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Prólogo 


La información es el núcleo de la organización. El cómo recopilar y analizar la 
información que se necesita continuamente para desarrollar y lograr las metas de 
la organización, objetivos y estrategias, identificar aquellas áreas cou problemas 
y crear métodos para lograr un control administrativo es tema de la metodología 
de la investigación. 

Es preocupación de la Facultad de Contaduría y Administración de la Uni- 
versidad Nacional Autónoma de México, que los profesionistas de la Contaduría 
Pública y la Administración, egresados de esta universidad y todas las institucio- 
nes afiliadas a la Asociación de Facultades y Escuelas de Contaduría y Adminis- 
tración de la República Mexicana, tengan amplia habilidad tanto teórica como 
práctica en la investigación científica en su campo profesional. 

Hemos estado dirigiendo las organizaciones en una época de crisis en la cual 
algunos problemas desaparecen paulatinamente y otros ocurren con más frecuen- 
cia, por tanto, la necesidad de investigar para generar información válida y confia- 
ble es más importante que nunca. Estamos en una etapa de adaptación continua. 
En la actualidad los problemas políticos, económicos y sociales de cualquier país 
influyen de una forma que no debemos esperar que desaparezcan ciertas dificul- 
tades para que el administrador pueda tomar una decisión, sine que debemos 
adaptarnos a este sistema continuamente cambiante. Para esto, el administrador 
requiere información sistemática, para seleccionarla y analizarla y con base en ello 
tomar decisiones adecuadas. Por lo tanto, la necesidad de conocer la metodología, 
recopilar y analizar la información para la toma de decisiones, cobra importancia 
vital en la Contaduría y Administración. 

De ahí mi interés en esta obra, resultado del conocimiento del autor como 
catedrático de la materia en el programa de Doctorado de la Facultad de Conta- 
duría y Administración e investigador científico de la misma facultad. 


10 PRÓLOGO 


Esta obra explica con fluidez y claridad todo el proceso de la investigación 
pura o científica e investigación aplicada o práctica, la recopilación de datos de 
fuentes secundarias y primarias, elaboración de cuestionarios, medición y escalas, 
codificación y el uso de cómputo para analizar datos. Explica la aplicación e 
interpretación para la toma de decisiones. También señala cómo preparar el in- 
forme de la investigación que sirva como guía para elaborar una tesis profesional. 
Además trata la ética profesional del investigador, que es base del desarrollo jus- 
to de cualquier sociedad, para que los profesionistas sirvan a México con plena 
honradez, honestidad y nacionalismo. En cada capítulo presenta numerosos ejem- 
plos aplicados a la Contaduría y Administración. 

Cabe mencionar que estamos viviendo una era de información masiva y que 
debemos de considerar la información como materia prima importante, así como 
otros recursos, y que la información válida y confiable sólo se logrará por medio 
de la investigación. 


C.P. Alfredo Adam Adam 
Director de la Facultad de 
Contaduría y Administración 
U.N.A,M, 


Introducción 


Un Administrador bien informado está 
consciente de sus decisiones 


El administrador actual vive y se desempeña en un medio que cambia con gran 
rapidez y que continúa acelerando la velocidad del cambio. No puede seguir 
pensando en sobrevivir los próximos meses en que se espera superar la crisis eco- 
nómica, sino debe de adaptarse a una situación de constante superación de difi- 
cultades. La supervivencia empresarial y el progreso sólo pueden cimentarse en 
buenas decisiones, en decisiones apoyadas en información confiable del medio 
ambiente. 

La situación mundial afecta a todos los países. Por lejanos que parezcan los 
problemas de El Salvador, Líbano, Golfo Pérsico, Brasil, afectan a todos los seres 
humanos y los administradores tienen que mantenerse atentos a ellos. Sus decisio- 
nes pueden contribuir a mejorar el país y de alguna manera influir en los movi- 
mientos económicos. Por otro lado, el rápido desarrollo de la tecnología, los 
cambios en la política internacional, el crecimiento de la población, las negocia- 
ciones de las autoridades hacendarias con los bancos del país y del mundo, las 
políticas económicas de la Unión Americana y otros acontecimientos mundiales, 
afectan a todas las industrias y al mercado nacional e internacional. 

El administrador mexicano debe estar consciente de todos esos movimientos 
y actuar con eficiencia. La crisis no durará un año sino que puede prolongarse in- 
definidamente y tenemos que adaptarnos a vivir con ella y superarla. El empresa- 
rio tiene que actuar ante los cambios y tomar decisiones eficaces y oportunas. 

Un apoyo importante para las buenas decisiones del administrador se obtiene 
de la información, sobre todo la derivada de investigaciones serias, válidas, confia- 
bles y de las que se deriven recomendaciones que sean factibles en la vida práctica. 
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1 INTRODUCCIÓN 


La información es un recurso muy importante, equiparable en su valor a los 
recursos económicos que el adrhinistrador utiliza en la producción de artículos 
que después ofrece al mercado. 

La información permite al administrador actuar como un tigre acechando 
constantemente las oportunidades, anticipándose a ellas, adaptándose a los cam- 
bios y superando las dificultades. 

Hay que considerar que la hora de las lamentaciones ha terminado, y se inicia 
el período de afrontar y vencer la crisis a base de trabajo, honestidad y amor a 
México. Necesitamos saber las causas de nuestros problemas para poder planear y 
llevar a cabo las estrategias adecuadas para solucionarlos y evitar que se repitan en 
el futuro. 

Se hace indispensable realizar los estudios necesarios para conocer nues- 
tra situación, lo que piensan de la organización a la que pertenecemos: traba- 
jadores, clientes, proveedores, inversionistas, funcionarios de la Banca y del 
Gobierno, legisladores, periodistas y administradores. Hay que definir hacia 
dónde se quiere ir y el cómo lograrlo, Todas estas inquietudes pueden encon- 
trar respuesta en esta obra aplicando la metodología sugerida. 

Aquí se habla de la importancia de la información y de la investigación, la 
ciencia y la administración, proceso y diseño de la investigación, medición y es- 
calas, métodos de recopilación de datos, construcción del cuestionario, codifica- 
ción, análisis e interpretación de datos, preparación del informe y, al final, se 
explica la ética profesional de un investigador. 


Dr. Mohammad Naghi Namakforoosh 
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CAPÍTULO 


1 


La información y su importancia 
para la toma de decisiones 


1.1 INTRODUCCIÓN 


Estamos en la era de la computación, de la comunicación vía satélite y de los 
sistemas de información. La nueva tecnología permite poner en práctica nue- 
vos sistemas de investigación y obtención de datos que antes no era posible 
realizar. Además, este avance tecnológico permite desarrollar nuevos conceptos 
y teorías sobre el almacenamiento, manipulación, análisis de la información y, 
al mismo tiempo, su transferencia a cualquier punto de muestro globo, vía 
satélite. La computadora y la investigación permiten recopilar la información 
necesaria, evaluar las alternativas y convertirlas en la base del proceso de toma 
de decisiones dentro de una organización. Esta información se emplea para 
conocer los problemas existentes, analizar alternativas de solución y poner en 
práctica los resultados de la decisión. En este capítulo se explica la importancia 
que tiene la información en la toma de decisiones y la evaluación del costo/be- 
neficio de la información. 


1.2 DECISIONES E INFORMACIONES 


El administrador/gerente debe alcanzar los objetivos de su organización por 
medio de las actividades predeterminadas de sus empleados. Esto implica saber 
qué deben hacer ellos, determinar cómo deben hacerlo, comprender cómo alen- 
tarlos a hacerlo y medir la efectividad de sus actividades. 

La actividad principal del gerente es la de dirigir, y dirigir consiste en tomar 
decisiones. En una definición simple podemos decir que decidir es simplemente 
escoger, entre las alternativas, la mejor. La decisión puede ser en situación de 
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certidumbre o de incertidumbre. Por lo general, cuando existe una situación 
para la toma de decisiones, el gerente se encuentra entre diferentes opciones 
de acción, y usualmente cada una de estas opciones está asociada a cierta in- 
certidumbre. En la figura 1.1 el “árbol de decisión”, se indican las relaciones 
entre diferentes alternativas. 

El árbol de decisión (figura 1.1) muestra que el administrador se enfrenta a 
acciones opcionales y que cada acción tiene dos o más posibles resultados. Exis- 
te incertidumbre porque no se sabe qué resultado tendrá la selección de una ac- 
ción particular, por ejemplo la D». 


Alternativas Posible resultado 
On 
0 On 
Dj O 
0, 


0; 
Dr a 
Os 
Figura 1.1 El proceso simple de la toma de una decisión. 


Sin alternativas no existirían situaciones para la toma de decisiones, ya que 
no habría necesidad de seleccionar, puesto que existe una sola acción factible. 

El proceso de seleccionar una acción específica dentro de una serie de 
acciones alternativas es la toma de una decisión. Este proceso es similar a pesar 
del contenido, propósito y naturaleza de la decisión que habrá de tomarse. 
Entonces, se puede decir que el administrador debe tener información o necesita 
entender el descubrimiento científico de cierto caso e incorporarlo en las tomas de 
decisiones, o traducir esta información a acciones. Podemos decir que la toma 
de decisiones es una función primordial del administrador. Esto es cierto si la res- 
ponsabilidad del administrador es financiera, de producción, de recursos hu- 
manos o de mercadotecnia y es válida sin considerar el nivel jerárquico del 
administrador. Herbert A. Simon! ganador del Premio Nobel de Literatura, dice 
que Administración y Toma de Decisiones es lo mismo, o sea, él define la Ad- 
ministración como la Toma de Decisiones. 


1 Simon Herbert A.. The New Science of Management Decision, Nueva York. Harper and Row, 
1960. 
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1.3 INFORMACIÓN Y TOMA DE DECISIONES 


Usted como administrador (gerente), está trabajando en un nuevo ámbito eco- 
nómico, político y social. Nuestra economía ha pasado de la base industrial a la 
base de la información. Por lo tanto debe tener nuevas habilidades, fórmulas y 
políticas definitivas para su organización y asumir grandes responsabilidades. 
Para enfrentarse a la cantidad y tipo de informaciones que se necesitan para re- 
solver los problemas de su institución, es muy importante que el gerente acepte 
y trabaje con estas nuevas realidades. 

Las organizaciones, instituciones públicas y privadas deben considerar la 
información como un recurso básico, un recurso que tenga el mismo grado de 
importancia que la materia prima o la energía. La información es esencial para la 
toma de decisiones, porque ayuda a formular diferentes alternativas y escoger 
la mejor; de esta forma aumenta la probabilidad de una decisión correcta. Por lo 
tanto, se puede decir que la administración y el manejo efectivo de la informa- 
ción son tareas importantes del gerente, 

Si existe información perfecta, la toma de decisiones será relativamente 
simple, porque las alternativas y resultados en tal situación serán conocidos. Sin 
embargo, es importante mencionar que la información no puede garantizar que 
se han considerado todas las posibles alternativas y que la información elimina 
completamente la incertidumbre. La información no elimina la necesidad de to- 
mar decisiones, sino facilita tomarlas. 

La figura 1.2 muestra la relación general que existe entre toma de deci- 
siones y la información. Para que el administrador (gerente) tome decisiones 


laformación a priori Información a priori 


Ámbito interno Ámbito externo 
Mercado 

Empleados Competencia 
Proveedores 


Gobierno 
Accionistas 


Público 


Financieros 


Figura 1.2 Relación entre la toma de decisiones e información. Fuente: modificado y 
adaptado de Robert Peterson, Marketing Research, Business Publishing, U.S.A. 
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efectivas, necesita tener información antes, durante y después de tomar la deci- 
sión. Esta información puede provenir de los ámbitos interno o externo. Se ne- 
cesita tener información antes de la toma de decisiones para conocer con claridad 
la problemática que se trata de resolver, teniendo en cuenta todos los factores 
controlables y no controlables y asegurar todas las posibles opciones. Se necesi- 
ta tener información durante la toma de decisiones para no equivocarse en la 
elección de las alternativas, así como también se requiere la información 
después de tomada la decisión, para controlar su resultado, evaluar y controlar 
su proceso y asegurar su efectividad. 


1.4 INFORMACIÓN Y PRODUCTIVIDAD 


En esta era de la información, gracias a la inmensa abundancia de datos de que 
disponemos, la productividad ha alcanzado una nueva dimensión, en donde el 
avance del conocimiento ha llegado a un nivel superior al de décadas pasadas. Es 
importante definir “productividad”, ya que el término ha tenido mala reputación, 
particularmente entre los trabajadores no administrativos. Muchos trabajadores 
asocian la palabra productividad con velocidad y piensan que aumentar la pro- 
ductividad supone trabajar más aprisa y más intensamente por la misma remu- 
neración. No es el caso, La productividad es mucho más que la relación entre los 
resultados de la producción y los insumos de mano de obra; también hay que in- 
cluir los insumos de información, equipo, energía y materiales. El administra- 
dor eficaz debe ser capaz de aumentar la productividad de una organización; no 
trabajando más intensamente y durante más tiempo, sino haciéndolo más inteli- 
gentemente y con mayor eficacia, gracias a que sabe en dónde está la informa- 
ción, cómo obtenerla con prontitud y cómo ponerla a trabajar con eficacia, 

Según Jackson Grayson.? “La productividad es una palabra que causa 
mucha confusión. Es una medida de la eficacia con la cual la gente produce bie- 
nes y servicios. La definición más simple es que se trata de la razón entre lo que 
se obtiene y lo que se invierte.” La productividad de los empleados se mejora 
dando realce y dignificación al trabajo, no amptiándolo ni haciéndolo más inten- 
so. Hay que apoyarse en la información que ya posee la gente y utilizarla para 
métodos innovadores y más productivos. 

En la era industrial, lo importante era la productividad del trabajador; ahora 
es la productividad del administrador. Ésta se apoya en el manejo de informa- 
ción para mejorar los resultados individuales y de la organización. La obsoles- 
cencia de los puestos ocurre más o menos cada siete años en las actuales 
sociedades desarrolladas, en las cuales hay información intensiva. Esto a menos 
que los individuos participen en programas de educación continua o adopten 
otros métodos que les permitan conocer las nuevas ideas y avances. 


? John Arnold y Mark Amold, Corporate Groups, The Wall Street Journal, junio 5, 1978. 
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La gente que dirige la empresa industrial, comercial o el gobierno, está au- 
tomotivada para lograr metas personales o grupales de su trabajo. La administra- 
ción debe proporcionar el conocimiento necesario a los trabajadores para que al 
recibir éstos la información que necesitan, se mantengan al día en sus campos de 
trabajo. La recompensa para la administración sería un cuadro de trabajadores 
altamente productivos que proporcionen a la organización nuevos productos y 
servicios, así como el perfil competitivo que resulte en utilidades o beneficios. 

La productividad de la información es otro concepto importante que debe 
analizarse en términos de: ¿qué tan valiosa es la información para la organi- 
zación y con qué eficiencia se le proporciona al usuario?, se volverá entonces un 
elemento primordial en las organizaciones que estén orientadas hacia la infor- 
mación. 


1.5 CRITERIOS PARA EVALUAR LA INFORMACIÓN 


Los siguientes son ciertos criterios que deben usarse para evaluar la información 
de que se disponga: 


+ Objetividad. La objetividad es un importante criterio al evaluar la informa- 
ción. La toma de decisiones basada en información sesgada, con per- 
cepciones personales del investigador, puede perjudicar el logro de los 
objetivos, 

Suficiencia. Otro elemento importante es la suficiencia de la información, 
la cual está determinada por la cantidad necesaria de ésta para la toma de 
decisiones. 

Confiabilidad. Hay que medir también la confiabilidad de la información 
y su periodicidad; o bien, su carácter eventual para resolver problemas 
del momento. 

Oportunidad. La oportunidad de la información es otro criterio a consi- 
derar para medir su productividad. La evaluación del costo y del benefi- 
cio que proporcione. 

Actualidad. Qué tan reciente es la información. 

Accesibilidad. La última medida de productividad es la accesibilidad de 
la información, de modo que puedan tener acceso a ella todos aquellos 
en la jerarquía de la organización que requieran conocerla para realizar 
mejor su trabajo. 


Estos son los criterios que el administrador puede utilizar para reducir cos- 
tos y aumentar los beneficios de la información. El administrador debe estar 
consciente de la imporiancia crítica de la información y debe saber cómo uti- 
lizarla de una forma más productiva. Debido a que la información se relaciona 
directamente con la productividad, se debe utilizar económica y hábilmente, 
como cualquier otro recurso valioso. 
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1.6 EL PODER DE LA INFORMACIÓN NEGATIVA 


En teoría, la información debe ser completamente objetiva y sin contenido emo- 
cional del investigador. En realidad, la información agradable, que además 
refuerza lo que el jefe o superior desea escuchar, nunca ha presentado proble- 
mas; éstos se presentan cuando las noticias son negativas, indeseables y están 
en desacuerdo con las ideas preconcebidas. 

En cualquier estudio existirán elementos positivos (noticias agradables), así 
como elementos negativos (noticias desagradables). Corresponde a un adminis- 
trador inteligente saber implementar ambos tipos de información en beneficio de 
la organización. Por lo general los puntos débiles “negativos” informan de la 
existencia de problemas a superar y corregir, y los puntos fuertes “positivos” 
dan la oportunidad de dar una imagen superior a la empresa. 

Por temor a que se les califique de negativos o desleales, muchos adminis- 
tradores del nivel medio practican una especie de engaño benigno, rechazando 
la voz honesta que les produce preocupación o llama su atención hacia proble- 
"mas, errores y juicios equivocados, a tiempo de corregirlos con mayor faci- 
lidad. 

La literatura y la historia de todos los tiempos y latitudes están llenas de his- 
torias en las que se sacrifica a los portadores de malas noticias por llevar in- 
formación precisa y comprobada, pero desagradable. Muchas leyendas hablan 
de mensajeros que, por no perturbar el ánimo de sus emperadores, retenían in- 
formación vital o demoraban su entrega hasta que era demasiado tarde para 
tomar las acciones que hubieran evitado el colapso del imperio, y, por su reti- 
cencia, esto último ocurre. 


1.7 UN MODELO PARA LA TOMA DE DECISIONES 


Para incrementar la probabilidad de que la decisión tomada sea la correcta, se 
debe usar un proceso sistemático de toma de decisiones. En esta sección el autor 
presenta un modelo sistemático general de toma de decisiones llamado “DECI- 
DE”, tal como se indica en la figura 1.3. Este modelo consta de seis etapas, Se 
puede usar para sistematizar cualquier proceso de toma de decisiones. 

El modelo DECIDE se puede aplicar siguiendo los pasos que en la siguiente 
página se mencionan, 

Una vez que se conoce la situación de la decisión, la primera etapa en el 
proceso de toma de decisiones será definir (D) el problema o la oportunidad. 
Esto implica especificar los objetivos de decisión y las restricciones. La 
primera etapa también requiere clasificar los síntomas de las causas del pro- 
blema. Finalmente, en el transcurso de la definición del problema es necesa- 
rio crear unas normas o reglas cuantitativas (medida de logro numérico). Esto 
permitirá la evaluación del proceso de toma de decisión, para su posible co- 
rrección. 
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Definir el problema especificando: 
Objetivos 

”=|D Restricciones 

Medida de logro 


Enumerar factores de decisión 
E Opciones (factores controlables) 
Incertidumbre (factores no controlables) 


Recabar información importante en: 
c Altemativas 
Posible resultado 


Identificar la mejor alternativa por medio 
I del desarrollo de la tabla matricial de 
evaluación 


Desarrollar e implementar planes para 
D poner en acción las alternativas 
seleccionadas 


ÍÉ ——— ]pvaluar la decisión y su proceso 


UT 


Figura 1,3 Fuente: Robert A. Peterson, Marketing Research Business Publications Inc., 
Plano, Texas, 1982, pág. 8. 


La segunda etapa es enumerar (B) diferentes acciones o alternativas. Esto se 
refiere a elaborar una lista de todas las alternativas (factores decisionales contro- 
lables y no controlables). 

La tercera etapa es la recopilación de datos (C) para cada diferente alter- 
nativa o posibles acciones y sus incertidumbres. Usualmente, esta información 
contiene las ventajas y desventajas de diferentes alternativas, así como sus 
posibilidades de ocurrencia. Después de la recopilación de esta información, la 
siguiente etapa es identificar (I) la alternativa más apropiada para tomar la de- 
cisión. Por lo general, esta acción se toma evaluando primero por las tablas 
matriciales, una tabla en la que la potencialidad de la interacción de diferentes 
alternativas de la toma de decisión puede cuantificarse (tabla de rendimiento). 
Después de esta evaluación, puede seleccionarse aquella alternativa que satisfa- 
ga las normas cuantitativas de la decisión. 

La quinta etapa de este modelo es desarrollar (D) e implementar para resol- 
ver problemas. La última etapa es evaluar (E) el resultado de la decisión y el 
proceso de ésta. La razón por la cual se hace esto es para controlar simultánea- 
mente la decisión actual y decisiones futuras. 
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1.8 LA EVALUACIÓN DEL GRADO DE UTILIDAD 
DE LA INFORMACIÓN 


Conceptualmente el “valor” de la información está reflejado por el grado en 
que la información facilite el proceso de toma de decisiones. En otras pala- 
bras, el valor de la información se mide por el grado en que aumentan las 
posibilidades de la toma de una decisión correcta. Implícitamente, en la pa- 
labra valor de la información se entiende también información adicional, o 
sea, cuando se habla del valor de la información se hace referencia a su valor 
incremental, 

Hay cierta situación de decisión en donde la información es potencialmente 
más valiosa que en otras, El valor de la información en forma muy simple está 
definida como: 


valor = beneficio de información — costos de información 


La utilidad de la información aumentará cuando los beneficios aumenten o 
cuando los costos disminuyan. Específicamente, la información es más útil para 
la toma de decisiones cuando hay más incertidumbre asociada a ella porque 
ayuda a disminuir la incertidumbre. 

La información pierde su valor cuando quien toma la decisión insiste en una 
alternativa, porque con esto limita el valor de las diferentes alternativas de 
decisión. 

La pregunta aún no tiene respuesta: ¿cuáles son los beneficios de tener 
buena información decisional? Intuitivamente parece que cierto tipo de informa- 
ción es más benéfico que otro. Entonces, ¿cuáles son las características que sir- 
ven para juzgar la información? 

En particular, para que la decisión sea acertada, la información debe tener 
las características mencionadas en el sector 1.5 de este capítulo. 


1.9 EVALUACIÓN DEL COSTO/BENEFICIO DE 
LA INFORMACIÓN 


Antes de realizar el estudio, tanto el investigador como el responsable de tomar 
decisiones deben evaluar los costos y beneficios de la información. 

Por lo general, hay cinco métodos para este fin: método de juicio, de simple 
ahorro, de valor presente, bayesiano y la tabla de recuperación. 


1.9,1 Método de juicio 
En este método quien toma decisiones, solo o con ayuda, evalúa subjetivamente 


los beneficios de la investigación contra los costos, y así llegará a ciertas conclu- 
siones. 
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Es difícil explicar este método; es un método subjetivo, pero principalmente 
se basa en la experiencia de quien toma la decisión, su actitud hacia asumir ries- 
gos, su inteligencia, su habilidad, y la situación de su organización con respecto 
a competencia. 


1.92 Método de ahorro 


El método empieza suponiendo que el responsable de tomar decisiones puede 
estimar los costos de equivocación de la toma de una decisión. Por ejemplo, su- 
ponga que el gerente tiene tres altemativas de decisión. Una decisión equivocada 
costará 1*000,000 de pesos. Tomando aleatoriamente una decisión, se estimó 
que el costo bajará a 0.33 X 1"000,000 = 330,000. Suponga que al tomar una 
decisión buena el costo disminuyera a 0.20 X 1"000,000 = 200,000. 

Si se dispone de una investigación, y la información proporcionada por ésta 
disminuye el costo de equivocación de la toma de decisión a 0.10, entonces el 
costo de equivocación, dados los resultados de la investigación, bajará a 100,000 
pesos; por lo tanto, quién haya tomado esta decisión puede ganar un máximo de 
200,000 — 100,000 = 100,000 pesos para la investigación. 


1.9.3 Método de valor presente 


Este método empieza considerando la investigación como una inversión. El 
valor presente neto (VPN) de una investigación, es la suma de la tasa de recu- 
peración (R) de la investigación, menos el costo (C) de la tasa de investiga- 
ción, descontado durante la vida de decisión. La recuperación de la investigación 
puede describirse como la diferencia estimada entre el rendimiento que calculó 
quien tomó la decisión con y sin investigación. Es decir: 


a 
R;- CH 
VPN = 
2 (1 + Ky 
donde = vida estimada de la decisión. 


= recuperación esperada durante el tiempo 7. 
costo esperado de la investigación durante el tiempo ?. 
= recuperación interna organizacional. 


¡3 
R 
Cc 
K 
Regla de decisión 


Si el VPN es positivo, efectuar la investigación. Si el VPN es negativo, no efec- 
tuar la investigación. 

Ejemplo: suponga que una empresa puede producir uno de tres nuevos pro- 
ductos. Su recuperación estimada y costos por el producto más rentable es como 
se indica en la tabla número 1, y la empresa usa una tasa de recuperación del 
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20% anual. Como se puede ver en la tabla, la empresa pierde dinero durante el 
primer año, porque la recuperación de la investigación es cero. Sin embargo, en 
el tercer año la investigación es muy rentable y el VPN llega a 197,700 durante 
los seis años en que transcurre Ja investigación. 


Tabla 1.1 

Recuperación Costos de la (R,- CM 

Año(t) dela investigación — investigación  (R,— C) (1+Ky (1+KY 
1 0 50,000 — 50,000 120 — 41,700 

2 50,000 30,000 20,000 1.44 19,900 

3 150,000 10,000 140,000 173 81,000 

4 200,000 10,000 190,000 2.07 91,600 

5 100,000 10,000 90,000 2.49 36,200 

6 50,000 0 50,000 2.99 16,700 


VPN $197,700 


Aunque este modelo es mejor que los dos anteriores, todavía existe subje- 
tividad en la estimación de los costos y la tasa interna de recuperación. Es cierto 
que diferentes estimaciones conducen a diferentes decisiones. La gran ventaja 
del VPN comparado con los otros dos métodos, es que la estimación de la recu- 
peración y de los costos de la investigación, asociados con la decisión de la 
investigación se hace más explícita. 


1.94 Método bayesiano 


Hay muchos modelos matemáticos que facilitan la toma de decisiones bajo in- 
certidumbre; varios de ellos son muy parecidos porque están basados en la teoría 
bayesiana. El modelo de toma de decisiones basado en la teoría de probabili- 
dades lo desarrolló Thomas Bayes hace 200 años. 

El marco general de la toma de decisiones consiste en seis etapas: 


+ Listar todas las alternativas factibles para tomar la decisión. 

. Listar los resultados posibles de la decisión para cada alternativa. 

.. Estimar la probabilidad de ocurrencia de cada resultado. 

.. Estimar la consecuencia ($, utilidad o pérdida), asociada con cada resul- 
tado de la decisión. 

. Evaluar el resultado de cada decisión calculando cada valor esperado. 

. Seleccionar la alternativa de toma de decisión que mejor se ajuste al eri- 
terio de decisión.3 


pon 


Dn 


3 David Eugene Smith, Quantitative Business Analysis (Nueva York, Joho Wiley £ Sons, 1977). 
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En general, el análisis de la decisión bayesiana consiste en tres diferentes 
etapas: 


+ Análisis anteriori, Es la etapa cuantitativa de la toma de decisión basa- 
da en informaciones existentes; por lo general se le conoce como análi- 
sis de árbol de decisión, 

+ Análisis ante-posteriori. Primordialmente consiste en evaluar informa- 
ciones adicionales en el marco decisional. 

+ Análisis posteriori. Consiste en evaluar las decisiones de una perspec- 
tiva revisando la decisión después de que se ha obtenido información 
adicional.4 


1.9.5 Tabla de recuperación 


Otro modelo para evaluar la decisión de si se realiza o no una investigación, es 
la tabla de recuperación. La tabla de recuperación y el modelo bayesiano se pue- 
den entender mejor con un ejemplo: 


El gerente de planificación de la empresa X, debe escoger un precio para un 
nuevo producto; el gerente tiene que considerar tres alternativas: 


ES 1: Estrategia de orientación a utilidad (precio unitario: 125 pesos). 

ES 2; Estrategia moderada (precio unitario: 100 pesos). 

ES 3: Estrategia de penetración u orientación hacia la participación de mer- 
cado (precio unitario: 75 pesos). 


El gerente reconoce que el precio deseable de cada estrategia depende del 
nivel de la demanda para el producto. Dichos niveles se indican en la tabla 1.2. 


Tabla 1.2 


Estado de naturaleza 


Alternativas Poca demanda Demanda moderada Demanda grande 


ES1 1,000 500 — 500 
ES2 500 1,000 - 250 
ES3 = 500 0 800 


La tabla 1.2, que muestra la situación de decisión, es una tabla de recu- 
peración. Éste es un ejemplo reducido, en donde hay tres alternativas y tres esta- 


4 Donalá R. Lehmann, Research Analysis (Homewood) IIL., Richard D. Irwin 1977, pp. 32-43, 
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dos de naturaleza, pero por lo general la situación es más complicada y requiere 
más cálculos que este ejemplo. Nótese que la tabla de recuperación tiene tres 
elementos: las alrernativas, los estados de naturaleza y las consecuencias. A las 
alternativas se les puede llamar acciones. 

El estado de naturaleza y los elementos no controlables del medio am- 
biente, pueden ser de dos tipos: aquellos sobre los que el investigador no pue- 
de influir, como consecuencias generales de la economía, y aquellos sobre 
los que el investigador puede influir como reacciones de la competencia. Estos 
dos elementos no controlables se consideran como el estado de naturaleza o 
variables ambientales, 

La tabla 1.25 indica que si el gerente toma la decisión ES1 cuando la de- 
manda es baja, la empresa puede esperar una utilidad de 1,000 pesos. Si la 
demanda es moderada la utilidad será de 500 pesos; mientras que si la deman- 
da es grande se puede esperar una pérdida de 500 pesos. Es posible que parezca 
extraño para el lector que la compañia pierda cuando hay mucha demanda y 
gane cuando hay poca demanda, pero hay que notar dos cosas: 


1. Los estados de naturaleza en sí no son importantes para explicar el pro- 
cedimiento bayesiano que afecta a las posibles decisiones, pero no al 
procedimiento en sí. 

2. Los números sí reflejan dos precios diferentes como ES1 y ES3 que re- 
presentan estrategias de precios de cosechar y precio de penetración (ter- 
minología de mercadotecnia) respectivamente. 


Dado que el efecto de otros factores es mínimo, se cree que la estrategia de 
penetración del precio será una buena decisión cuando la demanda de un pro- 
ducto es grande porque ayuda a aumentar la participación del mercado, mientras 
que cuando la demanda es baja, la estrategia del precio puede ser desastrosa.ó 

Para tomar decisiones se necesita saber qué estado de naturaleza ocurrirá; es 
decir, asignar probabilidades a cada estado. Según los datos históricos de la em- 
presa, se realizaron las siguientes asignaciones: 


Poca demanda ($1): P ($1) = 0.06 
Demanda moderada ($2): P ($2) = 0.03 
Mucha demanda (53): P ($3) = 0.01 


Análisis a priori 


Una vez que se tiene información preliminar, como la tabla de recuperación y 
las probabilidades, se tiene la capacidad de decidir si se debe realizar o no la 


3 Los datos de la tabla se pueden considerar como de recuperación en la que refleja el costo del capi- 
tal, para simplificar se escogen valores pequeños. 
$ Gilbert A. Churchill Jr. Metodological Fundarions, 3. edición, Dryden Press, 1982. 
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investigación. Esta decisión depende del valor anticipado de la investigación. Si 
el valor anticipado para la toma de decisión es alto, entonces es rentable realizar 
la investigación. Si el costo de la investigación es mayor que los beneficios es- 
perados, entonces no conviene llevar a cabo la investigación. 


Valor esperado 


Un criterio que se usa frecuentemente para comparar el valor potencial de la 
decisión sin investigación y con investigación, es el valor esperado. Valor es- 
perado es simplemente el promedio de las probabilidades de los estados de natu- 
raleza. 


% 
VE= Y PiVy 
1) 


Entonces, el valor esperado de las diferentes estrategias de precios en nues- 
tro ejemplo sería: 


VE de ES =0.6(1000) + (0.3K500) + (0.1)(—50) = 745 
VE de ES2 = 0.6( 500) + (0.3K.1000) + (0.1250) = 575 
VE de ES3 = 0.6(—500) + (0.3X0) + (0.1)(800) = — 220 


Suponga que la idea de quien tomó la decisión es maximizar el valor es- 
perado de recuperación; entonces dirigirá la estrategia ESl con un valor espe- 
rado de recuperación de 700. Esto indica que, sin investigación, quien toma la 
decisión eligirá ES1 y tendrá una VE = 700 pesos. 


Análisis a posteriori 


En esta etapa quien toma la decisión pide a varios consultores que presenten un 
proyecto de investigación basado en las necesidades de la empresa, cotizando el 
costo de la investigación. Después, quien toma la decisión debe comparar su 
valor esperado con el costo de la investigación. 


El valor de la información 


Una manera de comparar el incremento del valor esperado es cuando el investi- 
gador indica qué estado de naturaleza ocurrirá o si pronostica la demanda actual; 
entonces, quien toma la decisión puede simplemente decidir qué estrategia de 
precio elegir. 

Por ejemplo: si el investigador indica que la demanda será baja, quien toma 
la decisión seleccionaría el precio de cosecha con una recuperación de 1000 
pesos, ya que su recuperación es mayor que los 500 pesos asociados con el pre- 
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cio intermedio y que 500 pesos percibidos con el precio de penetración. Ade- 
más, si el investigador indica que la demanda será moderada, el precio moderado 
sería óptimo: y si indica aye la demanda sería alta, encss el grecia, de e 
netración sería el más conveniente. 

¿Con qué posibilidad quien toma la decisión puede seleccionar cada alterna- 
tiva de precio y ver la ganancia asociada con el precio? Esta posibilidad está 
dada por la probabilidad de que se indiquen los resultados de los estados de na- 
turaleza. Si resulta que es Sl, el gerente tomará la decisión ES1; si resulta 52, el 
gerente tomará la decisión ES2; y si resulta $3, el gerente tomará la decisión 
ES3. La mejor manera de poder estimar las posibilidades es utilizando la proba- 
bilidad asignada a cada estado, ya que no se da la opción de saber cuál estado de 
naturaleza resultará, sino sólo se sabe qué estado ocurrirá. Una vez que se ha 
dado la ocurrencia del estado de naturaleza, no hay necesidad de verificar su 
validez, porque el investigador puede afirmarlo con cierto grado de confian- 
za predeteminado. Entoces, se puede calcular el valor esperado con una certi- 
dumbre relativa. 


VE (certidumbre relativa) = (0.6X1000) + (0.3X(1000) + (0.1)(800) =980 
donde la consecuencia es la opción ES1 con Sl; la opción ES2 con $2; y la 
opción ES3 con 53. La diferencia entre el valor esperado con certidumbre relati- 
va y el valor esperado con incertidumbre para la decisión ES1, sería: 

Valor esperado de la información 
VE (cert.) — VE (incert.) = 980 — 700 = 280 
Es decir, por la información proveniente de la investigación se puede pagar 
hasta 280 pesos. En otras palabras, si el costo de la investigación es de 280 pe- 


sos, se decidirán las estrategias del precio con base en la información de la in- 
vestigación. 


CAPÍTULO 


2 


Ciencia y administración 


2.1 INTRODUCCIÓN 


El objetivo principal de la investigación en la ciencia administrativa es obtener 
informaciones válidas, confiables y seguras para la toma de decisiones. Sólo hay 
una manera de alcanzar tales objetivos, y es realizar estudios por medio del 
método científico. 

Desde el punto de vista científico, el campo administrativo no ha tenido un 
progreso significativo como muchas otras disciplinas, demostrando su relación 
con la ciencia. Pero desde el punto de vista de conceptos dinámicos, se puede 
decir que la investigación científica en el área administrativa puede ser científica 
como en cualquier otra disci ¡a, puede usar instrumentos técnicos y métodos 
de igual forma que en cualquier otra área de la investigación. También en la 
investigación en el área administrativa se pueden adoptar actitudes y éticas aso- 
ciadas con la ciencia que se aplican en toda investigación científica. 

Una explicación de los métodos científicos de la investigación empieza con 
el proceso de pensamiento racional, es decir, una discusión acerca de conceptos, 
definiciones e inferencias. 

En este capítulo se explica el lenguaje y el enfoque de la investigación cien- 
tífica para conocer y entender este tipo de investigación. 


2.2 INVESTIGACIONES EN EL ÁREA DE ADMINISTRACIÓN 


Se han dado varias definiciones; algunas abstractas, otras confundiendo el área 
administrativa con su relación con la ciencia básica; para tener una clara pers- 
pectiva de las investigaciones en la ciencia administrativa de: ¿cómo se lleva a 
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cabo?, ¿qué se puede hacer? y ¿qué no se debe esperar de ella? Se explicarán a 
continuación estos temas con algunos ejemplos: 


Primer caso 


Suponiendo que usted es vicepresidente general de un banco y le han pedido 
realizar un estudio entre seis bancos regionales que son posibles candidatos a 
afiliarse a su banco. 

Debe recopilar datos pertinentes y realizar una evaluación comparativa a 
fin de encontrar cuál es la posición de estas instituciones bancarias. Debido 
a la naturaleza de este caso, las fuentes lógicas para obtener datos acerca de 
estos bancos serían sus reportes internos, así como copias del informe anual 
correspondiente de cada banco. Usted analiza razones financieras y revisa pu- 
blicaciones, así como todas las fuentes secundarias disponibles con el fin de 
hacer un ánalisis muy extenso. Al fin, usted presenta un reporte enfatizando 
los problemas y oportunidades de cada banco. ¿Se considera esto una investi- 
gación? 


Segundo caso 


Suponga que usted es director de Recursos Humanos de una empresa transna- 
cional, Esta empresa tiene plantas en El Estado de México, Matehuala y Puebla. 
El subdirector general le pidió que preparara un informe acerca de los costos 
de vida en las ciudades donde la empresa tiene plantas. Este informe servirá de 
base para realizar negociaciones con las autoridades del sindicato de traba- 
jJadores. Para hacer usted su tarea consulta numerosas fuentes, pero finalmente 
encuentra que el centro de información del Partido Revolucionario Institucional 
(PRI) lleva a cabo esos estudios periódicamente. Usted se conforma con ese 
estudio, seleccionando los datos más recientes y los presenta al subdirector ge- 
neral, quien le encargó esta tarea. ¿Considera usted esto una investigación? 


Tercer caso 


La compañía Colores, S.A., fabricante de pinturas, ha observado irregularidades 
en la rentabilidad de la empresa. El presidente de la empresa piensa que el pro- 
blema está en el departamento de Inventarios. Esta empresa produce numerosos 
tipos de pigmentos y pinturas en varios tamaños. Usted, como asesor de la erm- 
presa, ha sido consultado y realiza una investigación respecto a la rotación de los 
productos, al sistema de almacenamiento y a la operación de envío de la mer- 
cancía, Al evaluar y analizar los datos se encuentra que las pérdidas se deben a 
fallas en el sistema de inventarios. Hay demasiada existencia de algunas pinturas 
y pigmentos mientras que otras están agotadas, por lo que llega a la conclusión 
de que no se genera información pertinente al inventario para planificar la pro- 
ducción de las pinturas eficientemente. 
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Después de revisar alguna literatura acerca de inventarios, comienza a 
recopilar datos específicos de un producto y trata de asimilar varias formas prác- 
ticas de reportes y reabastecimiento que podrían reflejarse en la venta y los cos- 
tos; toma usted el inventario y establece los pedidos futuros para asegurar el tipo 
de información a fin de poder planificar el patrón de pedidos, su promedio, 
tamaño y otros datos pertinentes. Considera varios diseños de informes, los tipos 
de relaciones y el ciclo de producción que se puede aplicar. Después de calcular 
los costos, elabora un modelo de simulación del proceso de inventario. De este 
modelo de simulación, escoge la opción más rentable y extrapola los resultados 
para los otros productos. Recomienda al director de la empresa que adopte el 
proceso de simulación. También en su informe indica la utilidad en tiempo y 
dinero que puede proporcionar la aplicación del modelo. ¿Considera esto una 
investigación? 


Cuarto caso 


Una compañía de llamadas de larga distancia desea incrementar el uso de su ser- 
vicio. La compañía ha reducido su tarifa durante las horas de menor demanda; 
pero aún así, el incremento no justifica la necesidad del equipo requerido para 
llamadas de larga distancia. Se pide a una empresa que se especializa en estudios 
económicos de mercado que investigue las motivaciones por las cuales la gente 
hace llamadas de larga distancia. 

El proyecto de investigación consiste en contestar las siguientes preguntas: 


a) ¿Qué factores económicos influyen sobre el número de llamadas de larga 
distancia que la gente realiza? 

b) ¿Qué factores sentimentales y actitudes influyen para que la gente haga 
llamadas de larga distancia? 

€) ¿Qué factores de carácter personal influyen para que la gente haga lla- 
madas de larga distancia? 


Se debe encontrar qué porcentaje de personas hace llamadas de larga distan- 
cia habitualmente y qué porcentaje las hace por influencia de algunos otros fac- 
tores. La frecuencia de llamadas de estos dos grupos es importante; además, hay 
que considerar otro factor que es la urgencia de la información. 

Se sabe que cuando surge el deseo de establecer contacto social, familiar o 
por emergencia, se hacen llamadas de larga distancia. Esta decisión depende de 
factores socioeconómicos, del conocimiento de los diferentes tipos de servicio 
disponible, y de las actitudes, percepción y experiencias previas que se tengan al 
hacer llamadas telefónicas. 

Con este marco teórico, la agencia de investigación escribe un cuestionario, 
selecciona las características de los participantes en el estudio y realiza 400 en- 
trevistas. La mitad de las entrevistas se llevarán a cabo entre gente que hace 
llamadas de larga distancia una vez o más cada dos semanas y la otra mitad 
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entre gente que hace llamadas de larga distancia con menor frecuencia. Los 
cuestionarios serán procesados por computadora, se efectuará un análisis y una 
evaluación de los resultados. De acuerdo con los resultados arrojados, se redac- 
tará un reporte donde no solamente se responden los objetivos del estudio, sino 
también se dan recomendaciones acerca de las acciones que debe tomar la 
empresa de llamadas de larga distancia. ¿Considera usted esto una investi- 
gación? 

Para responder a estas preguntas hay que saber qué significa Investigación 
en la administración. 

Por lo general, hay dos tipos de investigación. Una se Hama Investigación 
Aplicada y sirve para tomar acciones y establecer políticas y estrategias, La otra 
se puede llamar Investigación Pura. Ésta sirve para planificar y tomar decisiones 
importantes. La característica básica de la investigación aplicada es el énfasis en 
resolver problemas. En este sentido, los cuatro casos anteriores son aplicaciones 
de "Investigación Aplicada”. La investigación "pura" está también dirigida a 
resolver problemas; sin embargo, la investigación aplicada tiene un mayor énfa- 
sis hacia la toma de decisiones importantes y a largo plazo. 

Algunos investigadores piensan que las investigaciones! deben de ser 
puras o científicas, y rechazan los cuatro casos expuestos; pero la historia 
muestra que la ciencia tuvo su inicio en problemas pragmáticos de la vida 
real. Las investigaciones puras nacieron mucho después que la vida se desa- 
rrolló; así que si se considera sólo a los estudios puros como investigación, la 
definición de investigación será deficiente. 

En este libro se define la investigación científica (o pura) como una "inves- 
tigación sistemática, controlada, empírica y crítica de propuestas hipotéticas 
acerca de presuntas relaciones entre fenómenos naturales” 

Aceptar todas esas características ayudaría a distinguir la investigación 
"buena" de la "mala". Sin embargo, es necesario reconocer niveles desde lo ex- 
plorativo o meramente descriptivo, hasta lo definido. 

El concepto clásico del estudio puro "científico" exige la aprobación de 
hipótesis; pero en los estudios o investigaciones aplicadas, la definición de- 
ficiente del concepto "investigación" elimina dos tipos de investigaciones 
frecuentemente realizadas que son altamente valiosas. La primera es la inves- 
tigación exploratoria; en donde el investigador conoce poco el área de estudio, 
donde todavía no se ve la necesidad de desarrollar hipótesis. El segundo es un 
tipo de investigación donde el investigador busca contestar el quién, qué, 
dónde y cómo de un problema. Á este estudio se le llama investigación cien- 
tífica. 

A un nivel básico, la investigación en el área administrativa puede definirse 
de la siguiente manera: "Una búsqueda para llevar información confiable a la 
solución de problemas". La complejidad y sofisticación dependen de los obje- 


| Kelinger Fred, Investigación del Comportamiento, Técnicas y Metodología, segunda edición, 
Interamericano. México, 1975, p.7. 
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tivos, diseño, recursos y herramientas disponibles. El propósito de este libro es 
contribuir a indicar cómo realizar mejor una investigación en el área adminis- 
trativa. 


2.3 ¿QUÉ ES LA CIENCIA? 


James B. Conant, dice que hay dos puntos generalizados sobre la ciencia: el 
estático y el dinámico 

Según el punto de vista estático, ciencia es un cuerpo sistematizado de 
información que incluye principios, teorías y normas. Este punto de vista enfati- 
za los resultados acumulativos de la investigación y define la totalidad de nues- 
tro conocimiento actual. La labor del científico consiste en descubrir hechos y 
agregarlos al conjunto de información ya existente. 

El punto de vista dinámico considera la ciencia como un proceso. Quienes 
crean ciencia de este tipo dicen que las teorías y principios pronto se convertirán 
en dogma si no se someten a investigación y desarrollo continuos. 

Ambos conceptos (estático y dinámico) contribuyen a una definición com- 
pleta de ciencia, pero cabe mencionar otros puntos de vista que demuestran una 
mala comprensión de la ciencia. Algunos consideran a la ciencia como una tarea 
que consiste en llevar puesta una bata blanca, saber utilizar el estetoscopio y tra- 
bajar en un laboratorio. El científico es percibido como una persona peculiar que 
trabaja en el laboratorio, utiliza equipos complicados y realiza innumerables ex- 
perimentos con el fin de mejorar la suerte de la humanidad. 3 

Otros consideran al científico como un individuo distinguido que piensa, 
elabora complejas teorías y generalmente pasa el tiempo en una Torre de Marfil, 
aislado del mundo y sus problemas. Consideran al hombre de ciencia como un 
teórico bastante impráctico. 

Tambien hay personas que por no entender a la ciencia, consideran que la 
tarea del científico es trabajar en el mejoramiento de las invenciones y artefactos 
que usa el hombre. Se considera como ciencia la construcción de puentes, el per- 
feccionamiento de automóviles, la automatización de la industria, etcétera, 

Actualmente se está procurando que el desarrollo del país esté basado entre 
Otras cosas, en la ciencia y la tecnología. Sin embargo, cuando se habla de cien- 
cia únicamente se piensa en las ciencias exactas, no en las humanas y sociales. 
El doctor Lothar Knauth* dice que una interpretación de lo científico, desde el 
ángulo positivista, es pensar que la ciencia nos ¡leva a la exactitud y al control 


? James B. Conant, Science and Common Sense (New Haven, Conn: Yale University Press, 1951, 
pp.24-25, 

3 Fred N. Kerlinges, Foundation of Behavior Research, 2a. edición, Holt, Rinehart and Winston Inc., 
Nueva York, 1976. 

% León, Ana Lidia, Ciencia exacta contra ciencia social y humana, Excélsior, domingo 29 de enero 
de 1984. Sección cultural, p. 4. 
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absoluto de la realidad, Si bien es verdad que a través de las ciencias "exactas", 
se han podido obtener de la naturaleza productos y objetos antes desconocidos, 
hay que darse cuenta al mismo tiempo del contenido sumamente dialéctico del 
proceso de creación o de innovación científica, que a la vez que da soluciones 
cada vez más perfectas, produce también resultados que se pueden considerar 
nocivos, 

Hay que ver a la ciencia y a la tecnología no como una panacea de los de- 
más, sino solamente como una parte de la actividades creadoras del proceso 
de la historia humana. La idea científica que se dedica únicamente a producir un 
mundo material "más perfecto” es justamente una ficción: si se consideran los 
avances científicos actuales, se observa en México y América Latina una falta de 
interés en el desarrollo autónomo de las ciencias, especialmente aquellas que 
están relacionados con los campos de verdadera creación científica. 

El doctor Lothar Knauth dice que es falsa la situación supuestamente ad- 
versa entre las ciencias humanas y las ciencias supuestamente exactas. En 
primer lugar, sin intervención humana no hay ciencia y por lo tanto, las activi- 
dades que se dedican al desarrollo de la investigación científica y la elabora- 
ción tecnológica, forman sólo una fracción de la capacidad humana de pensar 
acerca de la realidad en que vivimos. Se requiere un análisis completo del mun- 
do en que estamos. 

Hay ciertos problemas originados por el desaprovechamiento de la capaci- 
dad humana. Uno de ellos estriba en lo poco que se utiliza la creatividad den- 
tro de la capacidad creadora humana. Esto es resultado de la tendencia que 
reduce la creatividad a una actividad científica “exacta”, que se preocupa sólo 
por la productividad industrial y no por los efectos que ésta genera; esto ha dado 
como resultado un proceso que ha creado una sociedad con mayor capacidad, 
entre Otras cosas, de usar la violencia para la destrucción del género humano y 
del medio ambiente, independientemente del credo o ideología que la motive. 

Todos los procesos históricos tienen su trasfondo en un problema de ca- 
pacidad de movilizar recursos para la producción y para fines bélicos. Están 
relacionados por el incremento de la capacidad de producción, lo que se logra 
mediante la investigación científica básica, el desarrollo tecnológico y su apli- 
cación en el proceso industrial. Podemos observar una manifestación contunden- 
te de esto en el caso de la energía atómica. Ésta posee un inmenso potencial de 
incrementar la productividad y el bienestar de la sociedad; sin embargo, su de- 
vastador potencial de destrucción es por todos conocido. La violencia no es algo 
nuevo; ha existido desde el principio del proceso histórico humano, en el cual 
siempre se ha procurado incrementar la capacidad de producir. no sólo para el 
bienestar, sino para tener mejores medios y métodos para fomentar la violencia e 
incluso, para someter y aún exterminar enemigos. 

El sometimiento a través del ejercicio de la capacidad de concaienar inves- 
tigación científica, elaboración tecnológica y aplicación industrial, tiene mucho 
que ver con el grado de dependencia de cada sociedad frente a cualquier otra. 
Sólo en la medida en que una sociedad pueda movilizarse en beneficio de su au- 
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tonomía, completamente consciente de las implicaciones de estos procesos, se 
puede hablar de un progreso y de un desplazamiento desde un mayor hasta un 
menor grado de dependencia dentro de los procesos de la revolución indus- 
trial. 

El doctor Lothar Knauth define a la ciencia como una amplia búsqueda, la 
apertura hacia el futuro o hacia nuevas maneras de comprender la realidad, El 
meollo del concepto científico es precisamente esta actitud abierta hacia la posi- 
blidad de encontrar nuevas soluciones para problemas nuevos o preexistentes en 
todo el proceso de transformación que sufre la sociedad, 


2.4 ¿ES CIENCIA LA ADMINISTRACIÓN? 


Para saber si la administración es ciencia o no, a continuación se describe 
analíticamente la figura 2.1. 


2.4.1 La ciencia es objetiva 


Cuando se afirma alguna situación que no tiene apoyo cuántitativo y metodo- 
lógico, se dice que es subjetiva, en vista de que interviene el gusto, sentimientos 
y educación de quién efectuó esa afirmación; aseveraciones como: "Picasso es el 
mejor pintor del mundo" son subjetivismos porque se refieren más a quien lo 
afirma que al objetivo de la información. 

Al relacionar esta característica con la Administración, se tiene la siguiente 
afirmación: "Las acciones de Teléfonos de México son muy caras”, la cual cae 


La ciencia es objetiva 


La ciencia emplea 
mediciones 


La ciencia se corrige! 
a Sí misma 


CARACTERÍSTICAS 
DELA CIENCIA 


La ciencia es un estudio] 
sistemático 


La ciencia especifica 
condiciones de observación 


La ciencia busca la 
generalización 


Figura 2.1 Fuente: Enrique Gutiérrez López, La Ciencía y Administración, manuscrito 
no publicado del curso de Metodología Avanzada de Investigación, programa de doc- 
torado, F.C.Y.A.U.N.A.M. 1983. 
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en el subjetivismo tratado antes, puesto que lo que para una persona es caro, 
para otra pudiera ser barato, 

En cambio, la aseveración: “Los sueldos en esa empresa son superiores 15% 
en promedio en comparación con los de la competencia en 1995" sí es una ase- 
veración objetiva. 

Sin embargo, las características de objetividad en Administración deben ser: 


+  Precisi 
+ Exactitud. 


La depreciación por ejemplo, no cumple con estas características debido a 
que el cálculo está dado por el tiempo en que el bien rinde frutos a la organi- 
zación, por lo que no es posible detener el tiempo y que coincida la depreciación 
con el informe financiero. 

La Administración, por lo tanto, no cumple con la característica de objeti- 
vidad. 


2.4.2 La ciencia emplea mediciones 
Para evitar ambigiledades de "mucho", "poco", "demasido”, "suficiente", etcéte- 
ra, la ciencia se vale de los métodos cuantitativos para que exista una generali- 
zación y se utilice un mismo lenguaje. 

Así, en la Administración se utilizan cantidades en presupuestos, se 
cuantifican los objetivos en unidades monetarias, unidades de producción, por- 
centajes, etcétera; sin embargo, es oportuno aclarar que no por utilizar nú- 
meros el administrador es un científico; para que lo sea, estos números deben 
obtenerse por medio de procesos lógicos racionales. 


2,4.3 La ciencia especifica condiciones de observación 


Se refiere a que el científico debe ser capaz de informar cuales son las condi- 
ciones necesarias para que el fenómeno pueda ser reproducido por cualquier otra 
persona en igualdad de circunstancias. De esta manera, la ciencia no se ve impe- 
dida por el espacio ni por el tiempo. 

En administración, es difícil que se engloben todas las variables que inter- 
vienen en una decisión administrativa para que se repita el mismo fenómeno; 
basta recordar que en la Administración las variables incontrolables como 
política y comportamiento humano tienen un papel muy importante. Por lo tan- 
to, la Administración no cumple con esta característica. 


2.4.4 La ciencia persigue la generalización 


El conocimiento científico es el mismo, sin importar razas, credos, tiempo y 
lugares geográficos; así, el conocimiento de la multiplicación, de la división, de 
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la suma, etcétera, es universal. Sin embargo, en el conocimiento administrativo, 
al aplicar técnicas que el humano adapta a un entorno cambiante (política, econo- 
mía, sociedad), no es posible que se generalicen. Los resultados que se obtengan 
en idénticas situaciones administrativas efectuadas por diferentes adminis- 
tradores en diferentes entornos, serán también diferentes: es por eso que la Ad- 
ministración no cumple con esta característica. 


2.4.5 La ciencia es un estudio sistemático 


El conocimiento científico, para serlo, debe obtenerse mediante un razonamiento 
lógico, el cual incluye un sistema y un método para llevarlo a cabo. La ase- 
veración: "Lavado científico de alfombras", será científico siempre y cuando se 
utilice un procedimiento para este lavado, desde el diagnóstico hasta el control. 

Todo el conocimiento administrativo está inmerso en metodologías; es 
decir, en diferentes mecanismos para tomar decisiones, para elaborar pre- 
supuestos y para administrar; así, tenemos entre los principales mecanismos: el 
proceso administrativo, metodología contable para la elaboración de estados fi- 
nancieros y procesos para la toma de decisiones. Por lo tanto, la Administración 
cumple con esta característica científica. 


2.4.6 La ciencia se corrige a sí misma 


Debido al desarrollo técnico-científico, el conocimiento tiene que sufrir cam- 
bios. Por ejemplo, hasta antes de principios de siglo se afirmaba que el átomo 
era indivisible; sin embargo, esta teoría se descartó, una vez que logró dividirse. 

En Administración, los primeros teóricos, como Frederick W. Taylor, afir- 
maron que el motivador único para el trabajador era el incentivo económico; sin 
embargo, esta teoría cayó en desuso al converger nuevos estudios, como el caso 
de la escala de necesidades de Maslow. Así, la Administración cumple con esta 
característica. 

De las explicaciones anteriores, podríamos llegar a la conclusión de que la 
Administración es una ciencia social, porque interviene en ella el hombre. Sin 
embargo, cuando se le compara con las características anteriores, se puede afir- 
mar que es una cuasiciencia o protociencia, o bien, para otros, una disciplina 
social. 


2.5 FUNDAMENTOS DEL MÉTODO CIENTÍFICO 


El objetivo primordial de la ciencia es explicar los fenómenos naturales, es de- 
cir, especificar cuáles variables están relacionadas con otras, y de qué manera se 
relacionan, capacitando así al investigador para predecir ciertas variables a partir 
de otras. Entonces, se puede concluir que la finalidad de la ciencia es la teoría, 
porque ésta se mide como un conjunto de conceptos sistemáticamente relaciona- 
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dos y definidos, así como de proposiciones que sirven para explicar y predecir 
fenómenos. 

Cuando se investiga, se intenta saber "qué es", a fin de predecir, explicar o 
entender los fenómenos. Por ejemplo, se podría desear responder las preguntas: 
“¿cuál será la reacción del empleado debido a la propuesta del nuevo plan de 
pensiones?” o: ¿por qué el precio de las acciones en el mercado es mayor cuando 
todos los indicadores normales sugieren que el mercado debería disminuir? Aquí 
se intenta identificas y caracterizar esta realidad al medirla y evaluarla de acuerdo 
con ciertas definiciones y clasificación de ideas, También se intenta desarrollar 
teorías acerca de cómo estas ideas deberían relacionarse, cada una de acuerdo 
con ciertas reglas de lógica. Antes de que puedan diseñarse tales esfuerzos de 
investigación, en una forma científica, se tendrá que ser capaz de tratar fácil- 
mente ideas tales como: conceptos, construcciones, niveles de abstracción, 
definiciones operacionales, proposiciones, hipótesis, modelos y teorías. Uno de 
los símbolos más significativos en la ciencia es el concepto,5 

La ciencia comienza con la formación de conceptos para describir el mundo 
empírico, adelantándose a relacionar tales conceptos en un sistema teórico. Los 
conceptos permiten la comunicación efectiva, es decir, ayudan a entender la cien- 
cia y la metodología científica, introducen un punto de vista, sirven para clasi- 
ficar y generalizar los resultados de la investigación, apoyan las construcciones 
teóricas, suponen hipótesis y sirven como base para seleccionar la metodología 
apropiada de la investigación. Entonces, se puede decir que el científico cate- 
goriza, estructura, ordena y generaliza sus experiencias y observaciones en tér- 
minos de conceptos. Los conceptos son los elementos críticos en cualquier 
teoría, porque definen las formas y contenidos de las teorías; por lo tanto, se 
puede decir que un concepto es una abstracción del significado de una realidad 
en la cual se asigna una palabra para hacer posible la comunicación de algo de 
esa realidad, 


2.5.1 Importancia de la investigación 


Los conceptos son básicos para toda idea y comunicación; sin embargo, todavía 
se presta poca atención a lo que son, cómo resultan y los problemas que surgen 
con su uso. Esas condiciones no podrían justificarse solas, considerando el suje- 
to aquí, si no fuera porque son problemas especiales en investigación que sur- 
gieron de la necesidad de precisarlos conceptual e imaginativamente. En esta 
obra se proponen conceptos de medición para probar esas hipótesis. 

Usando esos conceptos de medición se obtienen datos. Se podría en igual 
forma inventar nuevos conceptos para expresar nuestras ideas. El éxito de la 
investigación depende de qué tan claramente se conceptualiza y qué tan bien 


3 Un concepto es una abstracción que representa un objeto, una propiedad de un objeto o cierto fenó- 
meno, por ejemplo: “status social”, “rol”, “fuerza”, “burocracia” y “productividad”, son conceptos 
comunes en ciencias sociales. 
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otros entienden los conceptos que nosotros usamos. Por ejemplo, cuando se en- 
trevista a la gente acerca de equicad impositiva o fiscal, las preguntas que se 
usan necesitan tocar fielmente las actitudes de los entrevistados. Las actividades 
son abstractas; sin embargo, se tendrá que intentar medirlas usando pocos con- 
ceptos concretos, seleccionados en forma cuidadosa. 

El segundo reto es desarrollar los conceptos, a fin de que otros los entiendan 
claramente. Por ejemplo, se podría preguntar a los entrevistados acerca de su 
ingreso familiar total. Esto podría parecer un concepto claro, sin ambigiiedades, 
pero se recibirían respuestas diversas y confusas aunque limitara el concepto 
especificando: 1) el periodo, ya sea semanal, mensual o anual; 2) antes o des- 
pués del impuesto; 3) por el jefe de la familia solamente o por todos los miem- 
bros de la familia; y 4) por salario, por dividendos, por intereses y utilidades 
derivadas del capital (¿qué porcentaje del ingreso gasta en renta, descuentos a 
empleados, cupones para comer, etcétera?). 


2.6 ORÍGENES DE LOS CONCEPTOS 


Los conceptos que con frecuencia son de uso generalizado, han sido desarrolla- 
dos a través del tiempo mediante la costumbre de compartirlos, y se han adqui- 
rido por medio de la experiencia personal. Si se vive en otra sociedad se podría 
poseer muchos de los mismos conceptos (aunque frecuentemente en un lenguaje 
diferente. Sin embargo, algunos de los conceptos son únicos en una cultura par- 
ticular, y no son en realidad sujetos de traducción a otro idioma). 

Usualmente, los conceptos llenan el conjunto de nuestra comunicación al 
igual que en la investigación, pero con frecuencia se les puede conducir con difi- 
cultad al intentar tratar con un concepto poco común o una idea nueva. Una 
forma de manejar este problema es pedir prestado de otros idiomas o pedir 
prestadas palabras de otras áreas o temas para expresar un problema análogo. 
Por ejemplo, el concepto de gravitación se tomó de la física y se usa en mer- 
cadotecnia en un intento por explicar por qué la gente compra donde lo hace. El 
concepto de distancia se usa en la medición de actitudes de dos o más personas. 
El "umbral" se usa efectivamente para describir un concepto en estudios de per- 
cepción, mientras “velocidad” es un término prestado de la física que usa el 
economista. 

Se establece una hipótesis usando conceptos, se diseñan conceptos de medi- 
da para probar hipótesis, se recopila información con base en conceptos y en 
ocasiones se incrementan conceptos para expresar ideas. El éxito de una investi- 
gación se relaciona con la claridad de los conceptos usados y con la posibilidad 
de que otros entiendan nuestros conceptos. 

Para que los conceptos cumplan sus funciones deben ser claros, precisos y 
congruentes. Los conceptos alcanzarán estos objetivos si se definen conceptual y 
operacionalmente. Las definiciones conceptuales describen los conceptos usan- 
do términos primitivos y deductivos. Además, una definición operacional es una 
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serie de procedimientos y actividades que uno debe realizar para que se puedan 
observar los fenómenos representados por los conceptos. 

Las definiciones operacionales relacionan el nivel conceptual-teórico, con la 
observación empírica. 

Los científicos sociales consideran la teoría como el último logro de sus 
empresas científicas. A pesar de esto, existen consideraciones divergentes acerca 
del significado y la estructura de la teoría. Por lo general, se pueden distinguir 
cuatro niveles de teoría: 


a) Sistema de clasificación ad hoc 
b) Taxonomías 

c) Marcos conceptuales 

d) Sistemas teóricos. 


Esta clasificación de teoría se basa en la idea de Parsons y Shils, división 
que a continuación se explica brevemente.” 


2.7 SISTEMAS DE CLASIFICACIÓN AD HOC 


Consiste en categorías arbitrarias porque pueden resumir las observaciones em- 
píricas. Por ejemplo, si se pregunta a los mexicanos: ¿vivirían en armonía los 
mexicanos si continúan con el mismo sistema de Gobierno? Las respuestas 
pueden dividirse en cuatro categorías: 1) totalmente de acuerdo, 2) de acuerdo, 
3) en desacuerdo y 4) totalmente en desacuerdo. 


2.8 TAXONOMÍA 


Este segundo nivel de teoría consiste en elaborar un sistema de categorías que se 
ajuste a las observaciones, a fin de que sea posible describir la relación entre ca- 
tegorías. Por lo general, hay una interdependencia entre las categorías, de tal 
manera que la clasificación en una categoría llama la atención para el tratamien- 
to conceptual de otra. 

La taxonomía presenta dos funciones importantes en las investigaciones de 
ciencias sociales: 


1. Con una definición cuidadosa, ellas especifican la realidad empírica 
que se debe analizar e indican cómo se puede describir esta unidad. La 


$ Para mayor información, consultar: David y Chara Nachmias, Research Methods in the Social 
Services, 2a. edición, St. Martins Press, Nueva York, 1981, pp. 40-46. 

7 En la ciencia administrativa liza más el marco conceptual. El marco conceptual explica y 
predice la mayor parte de la división que dieron Parson y Shils, ellos decían que hay cuatro niveles 
de teorías. 
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idea principal de taxonomía es clasificar y describir al mismo tiempo. 
Cuando nos enfrentamos a cualquier sujeto de estudio, uno inmediata- 
mente puede identificar sus aspectos cruciales usando la taxonomía 
como una "lista de compra”. Probar la taxonomía es una segunda mira- 
da al sujeto X y muestra que los términos generales definen las dimen- 
siones que han identificado a X como contraparte. 

2. La segunda función de la taxonomía es resumir e incrementar los es- 
tudios descriptivos. La taxonomía no ofrece explicaciones; sólo des- 
cribe fenómenos empíricos tratando de clasificarlos para conocer los 
conceptos que representan fenómenos (por ejemplo: a cuánto ascienden 
los gastos en diferentes sectores). No explica o predice fenómenos (por 
ejemplo, ¿por qué el Gobierno gasta mucho en transporte y poco en 
agricultura?). 


2.9 MARCO CONCEPTUAL 


El tercer nivel de la teoría es el marco conceptual. En el marco conceptual se 
colocan sistemáticamente las categorías descriptivas en una estructura amplia 
tanto explícita como en proposiciones supuestas. La teoría de la comunicación 
puede servir como ejemplo del marco conceptual, donde se usan conceptos 
como "señales de transmisión” y "ruidos de canal” para analizar y explicar ob- 
servaciones empíricas. Asimismo, el mundo supuesto se puede imaginar sis- 
temáticamente. En este nivel de teoría hay interacciones continuas entre el 
“arco concepial y la Observación. Véase la figura 2.2, 


Fuente de 
En d 


Figura 2.2 Marco conceptual de la comunicación. ? 


2.10 SISTEMAS TEÓRICOS 


Representan una combinación de taxonomía y marco conceptual, pero ninguna 
descripción, explicación o predicción está combinada en forma sistemática. En 


$ Talcou Parsons y Eduard A. Shlils, Toward a general theory of action, Nueva York, Harper de 
Row, 1962, p. 50. 
? Warren Weaver, “The mathematics at communication”, Communication and Culture, Nueva York, 
McMillan, 1966. 
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este nivel la teoría llega a su definición clásica. Son un sistema de proposiciones 
que están interrelacionadas en una forma que permite que algunas sean deri- 
vadas de otras. 

Cuando existe tal sistema teórico en las ciencias sociales puede decirse que 
ya ha explicado y predicho los fenómenos en estudio, 

En resumen, se puede decir que la habilidad para tomar buenas decisiones 
se mide por el grado en que se combinan hechos y teorías (teorías y práctica). La 
teoría se utiliza para guiar nuestras decisiones, predicciones o explicaciones y 
sirve de varias formas: como una orientación que amplía el rango de los hechos 
que se requiere estudiar; sugiere un sistema para manejar los datos o clasificar- 
los de la mejor manera. También reúne lo que se conoce como objeto de estudio; 
en este sentido provee al investigador del estado actual del conocimiento y de 
las posibilidades de la investigación, 

Por lo tanto, la teoría es un conjunto de conceptos sistemáticamente inter- 
relacionados, definiciones y proposiciones que sirven para explicar y predecir 
fenómenos. 


2.11 MODELO 


Esta palabra ha venido a ser de muy difícil definición por lo amplio de su uso. 
Pot ejemplo, una definición es: "cualquier cosa usada para representar algo 
más”. "El propósito de un modelo es la representación de la relación entre dos 
conceptos, que tienen como prerrequisito un esquema conceptual”. 

En las ciencias sociales, usualmente los modelos consisten de símbolos en 
lugar de materia física. Esto es, las características de algún fenómeno experi- 
mental, incluyendo sus componentes y las relaciones entre sus componentes, se 
representan en arreglos lógicos entre los conceptos. Así que se puede defender 
más formalmente un modelo como una abstracción de la realidad que sirve para 
ordenar y simplificar nuestra apreciación de la realidad mientras continúa repre- 
sentando sus características esenciales. 


2.12 CRITERIOS DE UNA BUENA INVESTIGACIÓN 


Cuando se desea evaluar un proyecto de investigación que está relacionado con 
dos aspectos, el contenido (lecturas y conclusiones) y el grado de confianza que 
uno puede poner en el estudio y sus resultados (en síntesis, la calidad de la 
investigación) se puede emplear cierto número de criterios para evaluar tales 
estudios. Un escritor sugiere los siguientes siete requerimientos: !0 


10 Emork William, Business Research Methods, Richard D. Irwin, Inc. Homewood, 
Tllinois, U.S.A., 1980. 
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1. El propósito de la investigación, o el problema de que se trate se deberá 
definir y delinear claramente en términos precisos. La declaración del 
problema de investigación deberá incluir el análisis en sus elementos 
simples, su alcance, limitaciones y una precisa especificación del signifi- 
cado de todas las palabras importantes para la investigación. La inca- 
pacidad del investigador de hacer esto adecuadamente puede crear dudas 
legítimas en las mentes de los lectores de si el investigador tiene sufi- 
ciente entendimiento del problema para enfrentarse directamente a él. 

2. Los procedimientos que emplea el investigador se deberán describir con 
suficiente detalle para permitir a otro investigador repetir la investi- 
gación. Excepto cuando el secreto es impuesto por el interés nacional, 
los reportes de la investigación deberán revelar con honestidad la fuente 
de los datos y los medios por los cuales se obtuvieron. La omisión de 
detalles importantes de procedimiento, hace difícil o imposible estimar 
la validez y la confiabilidad de los datos y justificablemente debilita la 
confianza del lector en la investigación. 

3. El diseño del procedimiento de investigación deberá planearse cuida- 
dosamente para producir resultados que sean tan objetivos como po- 
sibles. Cuando se trata de una muestra poblacional, el reporte deberá 
incluir evidencia concerniente al grado de representatividad de la mues- 
tra. No deberá usarse un cuestionario cuando la evidencia más confiable 
sea disponible de fuentes documentadas o por observación directa. Las 
investigaciones bibliográficas deben de ser tan cuidadosas y comple- 
tas como sea posible. Los experimentos deben tener controles satisfacto- 
rios, Las observaciones directas deben registrarse por escrito tan pronto 
como sea posible después del suceso. Deben hacerse esfuerzos para mi- 
nimizar la influencia de sesgos personales en la selección y registro de 
datos. 

4. El investigador debe reportar, con franqueza, defectos en el diseño de los 
procedimientos y estimar su efecto sobre los descubrimientos o hallaz- 
gos. Existen muy pocos diseños de investigación perfectos, Algunas de 
las imperfecciones pueden tener poco efecto en la validez y confiabilidad 
de los datos; otras pueden invalidarlos completamente. Un investigador 
competente deberá ser sensible a los efectos de diseños imperfectos y 
su experiencia en analizar los datos deberá darle una base para esti- 
mar su influencia. 

5. Para revelar la importancia de los datos, el análisis debe ser el más idó- 
neo. Los métodos de análisis que se empleen deberán ser los más 
apropiados. El grado en el cuál este criterio se alcanza, frecuentemente 
es una buena medida de la competencia del investigador. Veinte años de 
experiencia en dirigir las investigaciones de graduados llevan al escritor 
a la conclusión de que un análisis adecuado de los datos es la fase más 
difícil de la investigación para el principiante. La validez y confiabilidad 
de los datos se deben verificar cuidadosamente. Los datos se deben clasi- 
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ficar en formas que ayuden al investigador a obtener conclusiones perti- 
nentes, Cuando se emplean métodos estadísticos se debe estimar la pro- 
babilidad y se deben aplicar los criterios de significación estadística. 


. Las conclusiones deberán confirmar aquello justificado por los datos de 


la investigación y limitadas a aquello por lo cual los datos proporcionan 
una base adecuada, Con frecuencia, los investigadores tienden a ampliar 
la base de aspiración, por incluir experiencias personales no sujetas a 
controles bajo la cual se obtuvieron los datos investigados. Esto tiende 
a disminuir la objetividad de la investigación y debilita la confianza en 
los descubrimientos. También es muy indeseable la muy frecuente 
práctica de sacar conclusiones de estudios de una limitada población y 
aplicarlas universalmente. Los buenos investigadores especifican las 
conclusiones bajo las cuales sus conclusiones parecen ser válidas. El fra- 
caso en hacerlo justificadamente debilita la confianza en la investi- 
gación. 


. La gran confianza en el investigador está garantizada si el investigador 


es experimentado, si tiene buena reputación como investigador y si es 
una persona íntegra, Con esto permite al lector de un reporte de investi- 
gación obtener suficiente información acerca del investigador, Este crite- 
rio podría ser una de las mejores bases para juzgar el grado de confianza 
en una parte de la investigación garantizada; por esta razón, el reporte de 
investigación deberá ser acompañado por suficiente información acerca 
de ta calidad del investigador. 

Se puede localizar, en el reporte en sí, alguna evidencia pertinente 
para estimar la competencia e integridad del investigador. El lenguaje 
que está limitando, aclarando y precisando; las aseveraciones que son 
cuidadosamente expresadas y mencionadas con la debida reserva, y un 
aparente esfuerzo por alcanzar la máxima objetividad, tienden a dejar 
una favorable impresión acerca del investigador. Además, las generaliza- 
ciones que eluden la evidencia sobre las cuales están basadas, exagera- 
ciones o una tendencia a la palabrería innecesaria causan una impresión 
desfavorable, 


Éste es un excelente conjunto de criterios para evaluar estudios de investi- 


gación, especialmente trabajos escolares. Sin embargo, es muy probable que 
cualquier lista sea inadecuada en sus detalles. Esta no es una excepción. Por 
ejemplo, el llamado para una clara definición de problemas de investigación 
(criterio 1), ignora un enfoque de investigación mayor como el estudio explo- 
ratorio. Este enfoque es particularmente útil en investigaciones en las que los 
problemas no están claros y los métodos no se han desarrollado. Entonces, tam- 
bién la restricción del secreto para casos de interés nacional (criterio 2) es de 
aplicación casi irreal en proyectos de investigación donde el secreto comercial 
pueda ser importante. No obstante, la mayor debilidad de ese criterio es su van- 
guardia. Por ejemplo, ¿cuánto detalle es “suficiente detalle”? ¿Qué ambiguo es 
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un elemento de juicio de esas frases?; así, ello tendrá siempre que ser para cual- 
quier declaración general de criterio. Mientras muchas prácticas son evidente- 
mente no científicas, por lo tanto inaceptables, otras son o están sujetas a la 
interpretación. Se tiene que agregar la experiencia y buen sentido en el balance. 

Un problema importante no cubierto adecuadamente por el criterio anterior 
es el del sesgo. Los patrocinadores de la investigación podrían contribuir a una 
investigación insatisfactoria a través de las presiones de intereses protegidos por 
la ley. El conocimiento del investigador acerca de los resultados que el patroci- 
nador probablemente podría ver, puede influenciar los descubrimientos o hallaz- 
gos. Este problema debe resolverse efectiva y rápidamente, Lo más conveniente 
es que el investigador asegure la aceptación del patrocinador antes de comenzar 
el estudio. Sin embargo, la función del investigador es descubrir la realidad, y 
qué podría conducir a ella. 

Es necesario tal entendimiento acerca de la investigación objetiva, pero un 
interés igualmente importante es que el investigador tendrá que entender los fun- 
damentos del método científico y emplearlos en cada paso. El resto de esta obra 
se relaciona con algunos de estos fundamentos. 


CAPÍTULO 


3 


El proceso de la investigación 


3.1 INTRODUCCIÓN 


Para llevar a cabo una investigación científica hay que realizar numerosas 
actividades. Unas en forma secuencial, otras en forma simultánea, y tomar 
varias decisiones en diferentes etapas de la investigación. Hay gran necesidad 
de planificar todo el proceso de la investigación; es decir, elaborar un proyec- 
to que indique claramente las etapas por realizar, definir qué es lo que se pre- 
tende hacer, qué tipo de investigación se realizará, qué tipo de datos se 
recopilarán y cómo; qué metodología se utilizará para analizar los datos, 
etcétera. Además, se debe aclarar el tiempo y el costo necesarios para cada 
etapa. 

Administrar las funciones de una investigación es análogo a otras funciones 
del administrador, como contabilidad, producción, finanzas, etcétera. Se necesita 
tomar decisiones acerca de las actividades que se deben realizar en el trayecto de 
una investigación. Para que una investigación científica sea administrada con 
eficiencia se deben planear todas las etapas de la investigación; es decir, escribir 
el proyecto de la investigación antes de su elaboración. 

Un proyecto de investigación es como el plano de un edificio. Cónstruir un 
edificio sin plano dará como resultado algo diferente de lo pensado. Así tam- 
bién, al realizar una investigación sin el proyecto existe una gran probabilidad 
de llegar a resultados totalmente diferentes de lo previsto. 

En la figura 3.1 se muestran las principales etapas de la investigación. En 
este capítulo se explica la primera etapa de la figura 3.1. En los siguientes capí- 
tulos se explicarán las demás etapas. 
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Desarrollo del modeto conceptual 
Definición ddel problema 
» Analizar para conocer su origen 
y naturaleza 
+ Analizar el antecedeme 


Determinar objetos de la investigación 
Especificar las preguntas 
Determinar las variables 


Diseño de la investigación 
Métodos de ta recopilación de datos | 


Instrumentos de Medición y escala |: 
Población y muestreo 
Datos: Tipos, fuentes, naturaleza 


Validación, codificación 
y captura 


Tabulación y análisis 
Interpretación 


Implantación ética 


Figura 3.1 El proceso de investigación científica. 


3,2 MARCO CONCEPTUAL 


Como el objetivo principal de las investigaciones científicas es llegar a teorías, 
se puede decir que todos los problemas de investigación comienzan con un pro- 
blema de teorización. La primera tarea de un investigador es traducir el proble- 
ma de la realidad y eso puede hacerse sólo si la teoría es implícita o explícita. 

Dentro del antecedente del problema de la investigación hay que expresar el 
marco conceptual o marco teórico. 

La figura 3.2 presenta un proceso de teorización en donde se consideran tres 
partes principales del proceso: la teoría, los métodos empíricos para la recolec- 
ción y la realidad.! Por ejemplo, en un proyecto de investigación que trata acerca 


'Rila y Matilda, Sociological Research: A case approach, Harcourt, Brace Jovanovich, Nueva York, 1963. 
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Teoría 


Objetivo 
Modelo concepival 


Figura 3.2 Proceso de teorización. (Fuente: Pádua, Jorge, Técnicas de Investigación 
Aplicadas a las Ciencias Sociales. Fondo de Cultura Económica, México, 1979, p. 28). 


de un modelo de administración financiera en las sociedades cooperativas de 
producción pesquera y sus implicaciones en la educación superior en ciencias 
administrativas, se define el marco teórico de la siguiente manera: “se delineará 
un marco teórico sobre los conceptos fundamentales del desarrollo cooperativo; 
este marco teórico también definirá la función financiera en las sociedades coo- 
perativas. Estos conceptos se generarán por medio de un investigador sobre la 
teoría de sociedades cooperativas adaptándola para el uso de México”. 

Además, estas elaboraciones teóricas servirán de base para la investigación 
de campo. 


3.3 DEFINICIÓN DEL PROBLEMA 


La etapa principal de una investigación científica es identificar el problema, dice 
Scott Green.? Un problema es un estímulo intelectual llamado por una respuesta 
en la forma de investigación científica. 

La investigación se origina por las necesidades de apoyo para las decisiones 
de la Administración, lo cual implica a su vez gran cantidad de temas basados en 
preguntas tales como: ¿hacia dónde debemos ir?, ¿cómo responderá el merca- 
do?, ¿cuánto es necesario invertir?, ¿qué está causando que nuestra participación 
de mercado disminuya?, ¿cuál es la razón del disgusto entre nuestros emplea- 
dos?, ¿por qué tenemos problemas de liquidez?, etcétera. Una pregunta específi- 
ca puede llevar a muchos estudios. 


2 Scott Green, The logic of Socia! Inquiry (Chicago, Addin, 1964), p-4. 
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No todos los estímulos intelectuales (problemas) se pueden estudiar científi- 
camente, En la etapa inicial de la investigación hay que preguntar si es investi- 
gable este problema. En general, los problemas que no se pueden estudiar 
empíricamente son aquellos que tienen un desempeño subjetivo, creencia y/o 
valores. Las observaciones que se llevan a cabo subjetivamente no se pueden 
estudiar científicamente. 

Para que una pregunta sea investigable, ésta debe ser de naturaleza tal que la 
observación y la recopilación de datos en el mundo real puedan dar una respuesta, 

La identificación real de un problema en la ciencia administrativa no es sim- 
ple. Por ejemplo, a veces el problema se presenta cuando las ventas decrecen 
precipitadamente o un nuevo competidor entra en el mercado. Tampoco es tan 
obvio identificar el problema. Por ejemplo, cuando aumenta el número de 
clientes descontentos con la empresa, cuando la calidad de la produccción es 
baja, cuando hay descontento entre los trabajadores, etcétera. 

Para el investigador es importante estar muy relacionado con las prioridades 
de la Administración, para ser más eficiente en sus funciones, Antes de tomar 
cualquier acción en la investigación, es importante conocer el problema clara- 
mente y tener los mismos conceptos que tienen los ejecutivos de la empresa; es 
decir, entender perfectamente la terminología que usan tanto el administrador 
como el investigador; entonces, la parte fundamental de toda investigación es el 
problema, 

El problema consta de dos partes: 


1. Título del problema. Es la presentación racional de lo que se investigará, 
precede al plan de la investigación y debe presentar una idea clara y pre- 
cisa del problema. 

2. Planteamiento del problema. Se origina a partir de una necesidad de 
tomar decisiones. El planteamiento establece la dirección del estudio para 
lograr ciertos objetivos, de manera que los datos pertinentes se recopilen 
teniendo en mente esos objetivos a fin de darles el significado que corres- 
ponda?, 


Un elemento clave para definir el problema es distinguir los síntomas de su 
situación. Es decir, es más fácil dedicar esfuerzos a detener una hemorragia 
nasal, que tratar su causa. El error ocurre porque el investigador estipula el sín- 
toma en vez del problema que lo provoca. 

Ejemplos: 


1.1 Problema enunciado. Mejorar la motivación de la fuerza de ventas. 


1.2 Problema real. Las ventas han caído por debajo de las cuotas, a causa 
de la combinación de dos problemas: 


3 Tamayo y Tamayo, Mario, El proceso de Investigación Científica, Limusa, 1983, p. 59. 
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a) Fallas de control de calidad. 
b) Actividades dinámicas de la competencia. 


2.1 Problema enunciado. Evaluar métodos para presuponer las ventas de un 
nuevo producto duradero. 
2.2 Problema real. Un fabricante hegemónico en el mercado estaba reali- 
zando el desarrollo de un nuevo producto duradero para un mercado 
potencial grande, pero no desarrollado aún. Tenía que decidir entre: 


4) Continuar el desarrollo del producto tal cual. 
b) Establecer qué características del producto serían las más atractivas. 
€) Para qué nivel de venta planificar. 


33.1 Análisis del problema. Su origen y su naturaleza 


Para identificar correctamente el problema se necesita examinar todas sus 
dimensiones, algo parecido a una auditoría en contabilidad, 

La primera etapa de este análisis es elaborar una lista de todos los elementos 
del problema que ya se conocen y todos los elementos que se conocerán. Elaborar 
tal lista permite conocer subproblemas si acaso existen (dentro de cada problema 
grande existen numerosos posibles problemas pequeños que pueden extraerse). 

Un gran beneficio de este análisis es que así se pueden distinguir los sín- 
tomas del problema, como también las causas. 

Por ejemplo, en 1993 la venta de productos de la Compañía X que se dedica 
a vender ciertos juegos de azar bajaron drásticamente; han tratado de dar más 
premios, de dividir un premio en 2o. y 3er. lugar. Las ventas no aumentaron, 
pero la disminución de venta era sólo un síntoma del problema real que era de 
insatisfacción y de inconformidad ante los partidarios de dicha compañía, mala 
distribución y mala información sin excluir la mala promoción. Todo esto causó 
frustración entre el canal de distribución y los aficionados; es decir, no tomaron 
en Cuenta a sus clientes o a sus vendedores. 

Otro beneficio de este análisis es que no sólo se puede identificar el proble- 
ma real, sino también se puede definir bien. 

Es importante identificar el problema apropiadamente, porque al no distin- 
guir los síntomas de sus causas específicas y definir un problema de una forma 
muy amplia o muy reducida, puede causar resultados incorrectos en la toma de 
decisiones, que pueden generar muchas pérdidas para la empresa. 

La clave de identificar el problema apropiadamente es la colaboración y 
comunicación entre el administrador y el investigador. Ellos deben realizar tra- 
bajos en estrecha coordinación para asegurar que están de acuerdo con la natu- 
raleza específica del problema; es decir, tienen que estar de acuerdo con los mar- 
cos conceptuales de la investigación. Esto implica que el investigador debe tener 
bastante conocimiento en el campo de la Administración y de la Investigación. 
Entonces, para identificar el problema correctamente, el administrador y el 
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investigador deben eliminar ciertas barreras, comunicarse bien y colaborar 
durante el proceso de la investigación. 


3.3.2 Análisis de antecedentes 


Una segunda actividad que necesita llevarse a cabo durante la identificación del 
problema es el análisis de antecedentes. El objetivo principal de este análisis es 
conocer las decisiones específicas en el ámbito del problema. 

Para identificar el problema se necesita la colaboración del administrador 
con el investigador. Sin embargo, el análisis de antecedentes es una tarea del 
investigador quien debe hacer entrevistas informales a los empleados, clientes, 
leer documentos y libros de la empresa. La amplitud de este paso de la investi- 
gación depende de la naturaleza de los problemas en estudio y de la experiencia 
del investigador. 

Como la identificación y definición del problema requiere creatividad, flexi- 
bilidad y minuciosidad para llevar a cabo un análisis de antecedentes con éxito y 
eficiencia, los investigadores deben tener las mismas características men- 
cionadas, además de paciencia. Muchos investigadores tratan de ignorar esta 
fase o de no dar importancia a este análisis, mientras que a veces los problemas 
se pueden solucionar con la información obtenida mediante el análisis de 
antecedentes. 

En general, el análisis de antecedentes es como un tipo de investigación 
exploratoria. El propósito de la investigación exploratoria es la generalización 
de ideas y perspectivas. Un análisis de antecedentes bien elaborado pone el 
problema en perspectiva respecto a su alcance y a sus propiedades. Además, 
proporciona flexibilidad a la investigación respecto a su beneficio potencial, 
sus costos y el tiempo que se requiere para el proyecto. Para lograr esos obje- 
tivos, también hay otras actividades que se elaboran en el análisis de 
antecedentes, como son: análisis situacional, revisión de literatura, discusión 
con expertos y elaboración del estudio en una escala muy pequeña (estudio 
piloto). 


Análisis situacional. Inicialmente, la investigación debe determinar por qué 
y cómo surgió el problema de la investigación. Mucho se puede aprender si 
se comenta el caso con gente dentro y fuera de la empresa. Precisamente, el 
objetivo del análisis situacional es observar rápidamente el medio ambiente 
interno y externo de la organización para identificar consecuencias poten- 
ciales y prácticas de la investigación. 

Revisión de la literatura. Casi todos los análisis de antecedentes requieren 
visitar bibliotecas para consultar libros, revistas, périodicos y reportes rela- 
cionados con el problema siendo investigado. La revisión de la literatura 
Puede estimular la perspectiva conceptual de la investigación para un análi- 
sis más adecuado. A veces, con la información obtenida en bibliotecas, se 
puede solucionar el problema destinado a la investigación. 
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Opinión de los investigadores experimentados. Discutir el problema con 
investigadores expertos que han realizado estudios al respecto, es una forma 
conveniente de hacer un análisis de antecedentes. Esta discusión es informal 
y hasta puede ser una plática por teléfono. 


3.4 DETERMINAR LA NECESIDAD DE LA INVESTIGACIÓN 


Después de identificar, definir el problema y analizar antecedentes, se pregun- 
ta, considerando las facetas importantes: ¿es necesaria una investigación cuan- 
titativa? 

En ciertas condiciones la respuesta a la pregunta puede ser “NO”. Podría no 
ser necesario invertir en un estudio cuantitativo, por varias razones: 


a) Se resolvió el problema con la información recopilada en el análisis de 
antecedentes. : 

b) Un estudio cualitativo (sesiones de grupo)* puede contestar las preguntas 
de este proyecto. 

c) No es factible alcanzar la solución del problema porque no se pueden 
recopilar datos confiables, o porque su costo es muy elevado, 


3,5 DETERMINAR LOS OBJETIVOS DE LA INVESTIGACIÓN 


Los objetivos de la investigación señalan los elementos del marco conceptual 
que se debe investigar. Usualmente los objetivos de la investigación se expresan 
en términos de una serie de objetivos de la empresa. Estos objetivos describen 
las perspectivas de la investigación y especifican lo que se espera de los resulta- 
dos de la investigación. 

Los objetivos deben tener en cuenta factores tales como: 


+ ¿Qué tipo de información se necesita? sl 
+ ¿A quién se debe informar de los resultados finales dela ,vestigación? 
+ ¿Quién utilizará los resultados para la toma de decisiones? 


Además, se debe dar respuesta con plena claridad a las siguientes preguntas: 


» ¿Qué información se busca? 
+ ¿Qué tanta información se necesita? 


* En el capítulo 4 se tratará el estudio cualitativo (sesiones de grupo). 
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» ¿Cuándo se necesita la información? 
+ ¿Con qué grado de confiabilidad se debe producir la información? 
+ ¿Qué nivel administrativo usará la información? 


3.6 ESPECIFICAR LAS PREGUNTAS 


Las preguntas de la investigación son declaraciones purificadas de los objetivos 
de la investigación y detalle de las informaciones que se deben proporcionar con 
su realización. Contienen todas las variables que se deben investigar. En esta 
etapa, el investigador determina las unidades del análisis y define las variables y 
las relaciones. 


3.7 VARIABLES 


El problema de la investigación se presenta como una serie de conceptos. Como 
se explica en el capítulo 2, los conceptos son abstracciones que representan 
fenómenos empíricos. Para pasar de la etapa conceptual de la investigación 
(marco conceptual) a la etapa empírica, los conceptos se convertirán en varia- 
bles. Las variables son presentaciones de los conceptos de la investigación que 
deben expresarse en forma de hipótesis. 

Los conceptos se convierten en variables al considerarlos dentro de una serie 
de valores. Para el próposito de la investigación, es importante hacer una distri- 
bución análitica entre variables dependientes, variables independientes y varia- 
bles de control. 


3.7.1 Variables dependientes e independientes 


La variable que el investigador desea explicar se considera como la variable 
dependiente. La variable que se espera que explique el cambio de la variable de- 
pendiente es referida como la variable independiente. Se supone que la variable 
independiente causará cambios en los valores de la variable dependiente; es 
decir, la variable dependiente es el resultado esperado de las variables indepen- 
dientes. A las variables dependientes también se les conoce como variables de 
criterio y a las variables independientes, como variables predictoras, 

En términos matemáticos, la variable dependiente es aquella que aparece a 
la izquierda de una ecuación. Por ejemplo: en Y = AX), se considera Y como 
variable dependiente y X como variable independiente. En este caso se dice que 
Y es una función de X. Suponga que un investigador quiere explicar por qué al- 
gunas personas participan en la política más que otras. Según las teorías de 
estratificación social, el investigador puede deducir que entre más alta sea la cla- 
se social de un individuo, la probabilidad de que tal individuo participe en la 
política es más alta. En este caso, la hipótesis es que la participación política es 
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el resultado de la clase social: entonces, la variable dependiente es la partici- 
pación política y la variable independiente es la clase social. 

La distinción entre las variables dependientes e independientes es netamente 
análitica y está basada en los objetivos de la investigación. En el ámbito empíri- 
co las variables no son dependientes ni independientes: es decisión del investi- 
gador cómo habrá de considerar las variables, y tal decisión se basará en los 
objetivos de la investigación. Una variable dependiente en una investigación 
puede ser variable independiente en otra. 

La mayoría de los fenómenos en el área de la administración que han sido 
investigados, se han considerado como causa de varias variables independientes; 
es decir, la mayoría de los fenómenos en el área de administración pueden, tener 
una o más variables dependientes y varias variables independientes. Esto ocurre 
porque una variable independiente por lo general explica cierta cantidad de 
variaciones del fenómeno en estudio, mientras que más variables independientes 
explicarán mayor variación del fenómeno. 


3.7.2 Variable de control 


La variable de control es función de aquellas variables en que se trata de reducir 
el riesgo de atribuir los cambios en la variable dependiente. Si los efectos de 
todas las variables relevantes se eliminan o controlan, y la relación empírica 
entre la variable independiente y la variable dependiente es sostenida, entonces 
la relación no es espuria. 

Relación espuria es aquella que puede explicarse por otra variable. En otras 
palabras, si el efecto de que todas las variables relevantes sean eliminadas (o 
controladas) y la relación empírica entre variables dependiente e independiente 
no continúa, entonces la relación es espuria. Esto implica que no hay una 
relación causal propia entre las variables y la relación observada sino que esta 
ocurrencia es accidental. 

Un ejemplo muestra el significado de la variable de control: suponga la 
relación entre la participación política (votación y críticas) y los gastos 
gubernamentales. ¿Es el monto del gasto gubernamental (variables dependientes) 
cansado por el grado de participación de los ciudadanos en la política (variable 
independiente)?, parece que sí, pero este fenómeno no se estudió en ciertos paí- 
ses desarrollados, tomando en cuenta el desarrollo económico (variable de con- 
«alyÍ Alkex Hayward encontró que el aivel de desarcallo económico influye 
tanto en los gastos gubernamentales como en la participación política. Sin la in- 
fluencia del desarrollo económico, no se puede observar la relación entre la par- 
ticipación política y los gastos gubernamentales. Entonces la variable de control 
sirve para probar si la relación observada entre las variables dependientes e inde- 
pendientes no son espurias. 


5 Alker Hayward, Marhematic and Polísics, Editorial McMillan, Nueva York, 1965. 
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3.7.3 Variables semidependientes 


Variable semidependiente es otra clasificación de variables, es una variable 
dependiente secundaria. Este tipo de variables se han encontrado en los proyec- 
tos de investigación en las áreas de contabilidad y administración. Se considera 
variable semidependiente aquella que tenga un efecto contingente o cooperante 
en la relación original entre las variables independientes y dependientes.6 

Ejemplo: una campaña publicitaria dirigida a fomentar el ahorro (V.1) 
traerá un aumento en los ahorros (V.D.), pero el efecto de publicidad es más 
notorio en las cuentas pequeñas de ahorros (V.S.D.). Otro ejemplo: Trabajar 
cuatro días a la semana (V.L), incrementa la productividad (V.D.) especialmente 
entre los trabajadores jóvenes (V.S.D.). 


3.74 Variables continuas y discontinuas 


Otro atributo importante de las variables es que las variables son continuas o 
discontinuas. Este atributo afecta el proceso de operación de las investigaciones, 
especialmente en los procesos de medición, análisis de datos y aplicación de 
métodos estadísticos. 

Una variable es continua si no tiene un tamaño unitario mínimo. Por ejem- 
plo: la producción de Coca Cola en todo el mundo puede ser de miles de mi- 
llones de litros pero también se puede medir como 1/1000 de litro para ciertas 
pruebas. Otro ejemplo puede ser los metrajes de producción de casimires; puede 
ser infinito o puede ser 1/100 de metro. 

Una variable es discontinua si tiene un tamaño unitario mínimo, Las cuentas 
bancarias son ejemplos típicos de las variables discontinuas. Una empresa puede 
tener en su cuenta 1,795.89 pesos o 1,795.90 pesos pero no puede ser 
1”795.89356. Diferentes cuentas bancarias no pueden variar más allá que el 
tamaño mínimo (un centavo). En general, todas las cantidades de las variables 
discontinuas se pueden multiplicar por la mínima unidad de la variable. El 
número de trabajadores en una empresa puede tener 300 o 400 trabajadores, 
pero no 350.5. Las variables cuyas cantidades no pueden subdividirse son varia- 
bles discretas o discontinuas. 


3.8 RELACIONES, DIRECCIÓN Y MAGNITUD 
Establecer una relación en investigación empírica consiste en determinar los va- 
lores de una variable que puede diferir de los valores de otra u otras. Cuando se 


dice que la variable X y la variable Y están relacionadas, se refiere a que hay 
algún nexo entre estas dos variables. Por ejemplo: cuando se dice que existe 


$ Emory. William, Business Research Methods, Richard D. Irwin, Inc. Homewood, Illinois, 1980. 
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relación entre la productividad de un individuo y su experiencia en el trabajo, se 
hace referencia a que las dos variables varían conjuntamente, La covarianza 
entre productividad y el tiempo de experiencia es común entre ambas variables; 
es decir, el individuo que tiene más experiencia, es más productivo, 

En investigaciones empíricas hay dos propiedades de la relación en que el 
investigador debe interesarse: dirección y magnitud. 


3.8.1 Dirección 


Cuando se habla de dirección se denota que la relación entre variables es positi- 
va O negativa. Una relación positiva es aquella en la que cuando incrementa el 
valor de una variable, también incrementará el valor de otra variable. Si la satis- 
facción de los empleados en el trabajo aumenta, su asistencia al trabajo aumen- 
tará, Si aumenta la cantidad en una cuenta de ahorro, aumentarán los intereses 
correspondientes. Si aumenta el nivel de educación del individuo, aumentarán 
sus ingresos. 

Una relación es negativa cuando el valor de una variable aumenta y el valor 
de otra disminuye. Por ejemplo, la velocidad con la que un trabajador ejecuta 
una tarea, y el tiempo que tarda en culminarla. 


3.8.2 Magnitud 


La magnitud de una relación es la extensión en que las variables covarían positi- 
va o negativamente, Cuando la magnitud de la relación entre dos variables es 
alta, la relación es más precisa. 

Por lo general, el rango de la magnitud de las relaciones estudiadas entre 
dos variables en Contabilidad, Administración y Ciencias Sociales es entre cero 
y perfecta. 


3.9 ESTIPULACIÓN DE LAS HIPÓTESIS 


El método científico es la sucesión de pasos que subyace en la mayoría de las 
investigaciones y que ha sido adoptado de las ciencias físicas. Incluye los si- 
guientes pasos: 


+ Estipulación de hipótesis. Se trata de concepciones preliminares acerca de 
la naturaleza de las cosas. Por ejemplo: la participación en el mercado y la 
publicidad tienen una relación positiva. 

+ Recopilación de datos, Se hace con el propósito de ver si las concepciones 
preliminares o hipótesis son correctas. 

+ Comparación de datos con los resultados hipotéticos (esperados). 

+ Rechazo o aceptación de la hipótesis, 
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Las hipótesis son respuestas tentativas a los problemas de investigación. 
Se expresan en forma de una relación entre las variables dependiente e inde- 
pendiente. Las hipótesis son conjeturas tentativas porque su veracidad se 
puede evaluar solamente después de que se han probado empíricamente. 
Deben tener las siguientes características: 


+ La extensión de hipótesis debe ser clara. Esto se puede lograr por medio 
de definiciones conceptuales y operacionales. 

+ Las expresiones de hipótesis deben ser libres de los valores propios del 
investigador. Deben ser libres de cualquier sesgo. 

+ La expresión de la hipótesis tiene que explicar las relaciones esperadas 
entre las variables en término de dirección y de la condición bajo la cual 
esas relaciones se mantienen, 

+ Las hipótesis deben ser medibles; es decir, la evaluación de las hipótesis 
depende de la existencia de métodos para probarlas. 

+ Las hipótesis deben ser la transformación directa de las preguntas de la 
investigación. 


Dependiendo de la situación de las decisiones y de la habilidad del investi- 
gador, la hipótesis puede ser formal o informal, expresada implícita o explícita- 
mente. Por lo general, si las decisiones que se van a tomar con los resultados de 
la investigación son importantes, entonces las hipótesis se expresan formal y 
explícitamente. Las investigaciones que consisten en recopilación de hechos o 
que están relacionadas con las decisiones operacionales, rara vez utilizan hipóte- 
sis formales y explícitamente expresadas. 

Las hipótesis van más allá de las preguntas de la investigación; son declara- 
ciones de las relaciones para especificar éstas. Con frecuencia el investigador 
necesita buscar información adicional que ya esté disponible. Tal información 
puede venir de una investigación anterior o de una teoría; puede venir del admi- 
nistrador o del mismo investigador. 

Finalmente, las hipótesis sirven como punto focal del proceso de la investi- 
gación. Cuando están expresadas en términos operacionales, efectivamente 
determinan qué datos se deben recopilar y qué análisis se deben aplicar a dichos 
datos. Cuando las hipótesis operacionales usan símbolos, se llaman hipótesis es- 
tadísticas. Cada hipótesis estadística consta de dos componentes: una hipótesis 
Nula (Ho) y una hipótesis Alternativa (Ha) (ver la figura 3.3), Los dos compo- 
nentes de la hipótesis constituyen una serie de hipótesis alternativas, pero 
mutuamente excluyentes y exhaustivas, 

Los pasos del método científico prevalecen cuando las hipótesis bajo prueba 
pueden ser refutables y repetibles en circunstancias generalmente imperturbadas. 
En realidad, el uso de esta metodología en el área de Administración y Conta- 
duría tiene problemas que es conveniente comentar, 
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Tipo de Ejemplo Interprezación Ejemplo operacional 
hipótesis estadístico 


Expresión — | Ho): Y + Ftx) | La hipótesis nula (+0) expresa que | La productividad está 

dela Hto: Y + F09 | la variable y no es una función de x | directamente rel. 

relación como (y = 2 + bx, o sea una | nada con la experien- 
relación lineal). mientras que la | cia. 

hipótesis alternativa Hía) expresa 

que y es una función de x. 


Expresión — | Ho:x>) La hipótesis nula expresa que el | El número de hom- 
de Hax<y valor de x es mayor al de y, mien- | bres que compra per- 
la magnitud tras la hipótesis alternativa Ha | fume Chanel, es 
indica que el valor de x es menor | menor al de mujeres 
alde y. que lo compran. 
Expresión — | Ho:x=y La hipótesis nula Ho expresa que | La participación de 
de Ha:x+y el valor de x no es igual al valor de | mercado de Uniroyal 
igualdad y, mientras que la hipotesis alter- | y Firestone es igual en 


nativa Ha indica que los valores de | el mercado mexicano. 
las variables x y y son iguales. 


Figura 3,3 Hipótesis ustrativas. 


En primer término, si bien en un laboratorio se pueden probar hipótesis 
mediante una recreación de un ambiente exactamente igual al de la vida real, las 
características del medio ambiente en que se desarrolla la prueba de hipótesis 
son cambiantes y difícilmente se presentan características de “laboratorio” que 
den como resultado un ambiente exactamente predecible. Debido a que quienes 
son sujetos del experimento son personas, las características individuales no son 
replicables. A pesar de estos inconvenientes, los procedimientos generales del 
método científico se han adaptado a las ciencias sociales y entre ellas al compor- 
tamiento de las personas que actúan en el ámbito de trabajo. Como el admi- 
nistrador requiere del conocimiento de las características de su ámbito de trabajo 
(trabajadores y empleados) y su mercado, se considera una práctica sana y 
recomendable la investigación con base en criterios similares a los del método 
científico. 

Para decidirse respecto a las hipótesis hay que entender primero el tipo de 
investigación de que se trata. La categorización más común incluye desde la 
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exploratoria (supone la inexistencia de nociones preconcebidas) hasta la causal 
(supone una preconcepción específica de cómo una o más variables influyen en 
otra u otras variables). En total son tres categorías: exploratoria, descriptiva y 
causal 


3.10 DISEÑO DE LA INVESTIGACIÓN / TIPOS DE ESTUDIO 
3.10.1 Estudio exploratorio 


Su propósito es encontrar lo suficiente acerca de un problema para formular 
hipótesis útiles. Empieza con descripciones generales del problema. En general, 
tienen pocas o ninguna hipótesis formales (no tienen nociones preconcebidas) y 
utiliza métodos “suaves”: entrevistas, grupos de trabajo para poner el problema 
“en foco” y probar a los empleados. La idea principal de este estudio es obtener 
un conocimiento más amplio respecto al problema del estudio. Un estudio cuali- 
tativo es un muy buen ejemplo de estudio exploratorio. 


3.10,2 Estudio descriptivo 


Está en el camino a lo largo del continuo que va del expioratorio al causal. 
Supone que se conocen las variables pertinentes al problema. Sus hipótesis son 
de tipo general: “X” y “Y”, se relacionan en el estudio de mercado, por ejemplo: 
sus resultados tienden a ser perfil de compradores contra perfil de no com- 
pradores, etcétera. 


3.10.3 Estudio causal 


Es el tipo de estudio más exigente. Para realizarlo se deben conocer las variables 
pertinentes y cómo afectan unas a las otras (supone una preocupación específica 
de cómo una o más variables influyen en otra u otras variables). La atención se 
concentra en dos aspectos: 


a) Confirmar o desaprobar las relaciones hipotéticas; y, 

b) Como las hipótesis son tan específcas que se conoce la forma matemática 
de la relación (por ejemplo, y = a + bx), hay que estimar los parámetros y 
la fuerza de la relación. 


La investigación exploratoria es importante porque evita que las nociones 
preconcebidas se excluyan de la actividad científica con la consiguiente pérdida 
de su potencial de resultados útiles. Por lo general, foma parte introductoria de 
la investigación descriptiva o casual, al seleccionar qué datos recolectar y la 
forma en que se dará la información. El investigador establece en hipótesis sus 
preconcepciones acerca del problema y debe tener presente que si bien la inves- 
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tigación exploratoria es útil para tener ideas e incluso hipótesis, es débil base 
para tomar decisiones; y que sus resultados pueden no confirmarse por el análi- 
sis estadístico. Habrá que hacer investigación causal y no solamente a nivel 
exploratorio, 

La hipótesis dicta los estados que se necesitan; la selección del tipo de estu- 
dio, de los medios para realizarlo. Antes de gastar tiempo, dinero y esfuerzo en 
recolectar datos, conviene analizar los que ya se tengan y evaluar su utilidad 
para la investigación. 


3.11 MÉTODO DE RECOPILACIÓN DE DATOS 


En el supuesto caso de que se necesiten nuevos datos (justificados por un análi- 
sis de beneficio/costo), se pueden obtener mediante observación, interrogatorio y 
simulación. 


3.111 Observación 


La forma obvia de recopilar datos nuevos es observar el comportamiento, bien 
sea en un ambiente o escenario natural (donde la gente actúa libre y normal- 
mente), en una situación controlada (de laboratorio) o en una observación direc- 
ta. La observación se puede realizar de manera discreta, para que la gente no 
detecte que está siendo observada (con cámaras ocultas, por ejemplo), o abierta- 
mente por medio de observación personal o remota. 

La ventaja de observar directamente el comportamiento es que la informa- 
ción se obtiene también directamente (por ejemplo: ¿siguen los empleados los 
reglamentos de la empresa?, ¿cómo es el comportamiento de los jóvenes entre 
16 y 20 años en una manifestación política?, ¿compran los consumidores nuestra 
marca?, ¿usan los cupones?, ¿leen la publicidad en el lugar de compras?). Las 
desventajas son sus altos costos y probabilidad de afectar el comportamiento del 
sujeto en observación. Hay tambien un efecto directo sobre el comportamiento 
en cualquier método de medición: al llamar la atención de un individuo sobre un 
aspecto particular del comportamiento, puede pensar en él más conscientemente, 
lo cual a su vez puede provocar que el comportamiento cambie; por ello, los 
métodos de medición pueden crear agentes de cambio tan importantes como la 
publicidad y las promociones, por lo que hay que ser cuidadoso y asegurarse de 
que el comportamiento en observación sea típico del mundo real y no un artefac- 
to del proceso que se emplee para recopilar datos. 


3.112 Interrogatorio 


Es el método más conocido de recopilación de datos nuevos, a tal grado que 
mucha gente confunde la investigación con la realización de interrogatorios. 
Muchas veces los estudios de observación se complementan con la aplicación de 
un cuestionario en una encuesta. 
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Este método es menos costoso que la observación directa y puede cubrir 
áreas que no se pueden someter a observación directa, como son la toma de 
conciencia, las actitudes y las intenciones. Sus mayores desventajas son que 
las respuestas pueden ser imprecisas (por un error de memoria) o no son sin- 
ceras (por un intento consciente de distorsionar los hechos) o influenciadas 
por la corriente del pensamiento de moda (declararse a favor de la ecología, por 
ejemplo). 


3.11.3 Simulación 


En este método se utilizan datos históricos ya existentes (del pasado) y modelos 
para proyectar la respuesta a la pregunta: ¿que ocurrirá si...,? Como base, se usa 
un modelo de la situación (por ejemplo: Ventas = 2.73 + 4.12 publicidad + 
logídistribución porcentual) + ..., y se proyectan resultados para diferentes situa- 
ciones hipotéticas simulando los resultados reales. Si bien los modelos simples 
se pueden resolver analíticamente, los más complejos desafían la solución fácil y 
los resultados se simulan en muchas tentativas; por lo general empleando una 
computadora. 

La ventaja de estos modelos es que se pueden dirigir hacia dar respuesta a 
preguntas de los gerentes o administradores sin que sea necesaria la recopilación 
de nuevos datos. La desventaja consiste en que si el modelo es defectuoso, o si 
los datos históricos que se hubieran empleado para calibrar el modelo ya no 
vienen al caso, los resultados serán engañosos y no hay manera de saber a priori 
que los resultados van a ser malos. 


3.12 CONTROL DE ESTÍMULOS 


Para seleccionar el tipo de estudio hay que decidir el estímulo al que se expon- 
drán los sujetos durante el transcurso del proceso de recopilar datos, lo cual 
depende a su vez del grado de firmeza y estrechez con que se haya enfocado la 
definición del problema. Cuando la definición es estrecha, los sujetos se expo- 
nen a pruebas predeterminadas y controladas; cuando los problemas se definen 
holgadamente será mucho menos probable que se requiera control y experimen- 
tos. En pocas palabras, reclaman experimentos las situaciones en las que: a) los 
sujetos deben ser expuestos a ciertos estímulos y, b) el investigador controla el 
estímulo al que vayan a ser expuestos. 

La forma más simple de un experimento es conservar constantes todas las 
variables controlables excepto una, y ver cómo, al variar ésta, se afecta el 
comportamiento de otra variable. Para establecer un experimento se recomien- 
da: a) ser lógico, esmerado y cuidadoso y b) si se tiene poca confianza en la 
propia lógica, consultar una buena referencia bibliográfica en diseño experi- 
mental. 
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3.13 DISEÑO DEL INSTRUMENTO DE MEDICIÓN 


El término “instrumento de prueba” es un indicador para demostrar que los datos 
se derivan de un método de recuperación de datos. Por ejemplo, en un experi- 
mento de laboratorio en que se coloque astillas en pilas para indicar la importan- 
cia relativa de los atributos, las astillas sirven como instrumento de prueba. 

En el caso de una encuesta o escrutinio de opinión, hay que elegir entre pre- 
guntas directas o indirectas; estas últimas pueden “embaucar” a los interrogados 
a hacer que den respuestas verdaderas acerca de asuntos delicados o que puedan 
provocar susceptibilidades, por ejemplo, la técnica proyectiva de preguntar lo 
que su vecino pensaría acerca del tema. Se tiene también la alternativa de pre- 
guntas con respuestas estructuradas, entre las cuales elegirá el sujeto y pregun- 
tas con respuestas abiertas; las primeras dan resultado cuyo análisis es más fácil 
y tiene mayores efectos en la medición, en tanto que las segundas implican un 
análisis más lento y dificultades en la acumulación de datos debido entre otras 
causas, a que los entrevistados pueden extenderse en la respuesta. Otros aspectos 
por considerar son el formato del cuestionario, el orden de las preguntas y la 
cantidad de ellas o extensión del cuestionario. 

Un riesgo potencial al diseñar vn instrumento de prueba es que puede vol- 
verse un “arca de inquietudes” para muy diferentes necesidades o incógnitas del 
investigador. Sus preguntas deben reducirse a las estrictamente necesarias para 
satisfacer los objetivos de la investigación. 


3.13.1 Plan de análisis 


Antes de empezar a recopilar datos hay que planear los análisis por realizar y 
especificarlos con todo detalle, con lo cual se ahorrará tiempo durante la recolec- 
ción y se preverá si los cuestionarios están bien preparados o no, si tienen pre- 
guntas redundantes o faltantes. 

También conviene especificar previamente qué niveles de resultados se 
pueden alcanzar y qué acciones deben tomarse para evitar tanto los errores al 
interpretar el significado de los resultados como los sesgos; es decir, la propen- 
sión a dejarnos llevar en las conclusiones, por nuestros deseos profundos. 

Entonces, hay que visualizatr los acontecimientos (eventos) que puedan 
afectar los resultados del estudio y las decisiones probables. 

En la actualidad también conviene definir en esta etapa de planificación, la 
disponibilidad y necesidades de rutinas análiticas y programas de computadora, 
de modo que si los análisis que se planifiquen requieren que los datos se presen- 
ten en cierta forma, ésta se incluya en el instrumento de prueba. Puede ser el 
caso (aunque poco frecuente) que se necesite desarrollar un nuevo procedimien- 
to para una aplicación. 
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3.14 MEDICIÓN Y ESCALA 


Un aspecto muy importante en este punto es la determinación de escalas para la 
medición de los fenómenos que se quieren incluir en la investigación. Una es- 
cala existe cuando es posible la determinación de una expresión cuantitativa de 
un estado dentro de una serie de estados. Un vicio de nuestra información suele 
ser el pensar en términos de escalas para efectos de toma de decisiones. En efec- 
to, es conveniente observar algunos de los elementos básicos de la medición por 
medio de escalas en las ciencias sociales,” 


p7 


. Medición. Se lleva a cabo por medio de cuatro niveles generales de 


medición que son: nominal, ordinal, intervalar y racional o de relación. 


4) El nivel nominal implica la pertenencia o no a un grupo. 

b) El nivel ordinal implica la pertenencia, pero tiene un efecto de transmisi- 
bilidad en el orden de la relación de los fenómenos. Por ejemplo, un 
director tiene más autoridad que un gerente de proceso; sin embargo, no 
es posible cuantificar la diferencia de autoridad correspondiente. 

C) El nivel intervalar, como lo indica su nombre, mide la distancia en 
intervalos. A igual distancia en intervalos corresponde igual diferencia 
en el fenómeno. Un ejemplo es la escala de medición de temperatura, 
en que una diferencia de dos grados es siempre la misma distancia 
recorrida en el termómetro. 

d) El nivel racional o de relación existe con intervalos similares a los de la 
escala intervalar. Sin embargo, su medición implica una relación de 
conversión directa entre escalas que miden el mismo fenómeno. En los 
casos de escala racional existe siempre un origen común. 


. Dimensionalización. Este concepto se explica debido a que la aplicación 


de una escala representa una o varias dimensiones. 


. Modo de inclusión o rechazo de ítems. Puede ser con base en: 


a) Jueces o personas expertas en la materia bajo juicio. Por ejemplo, en el 
caso de campañas para el control natal pueden intervenir ginecólogos o 
expertos sociólogos. 

b) Respuestas directas, sin necesidad de escala. 

c) Una combinación de unas y otras. 


7 Para mayor profundidad en este tema en específico se recomienda ver Padúa y Ahman H.A. Pezechea y 
C. Boroshi, Técnicas de Investigación aplicadas en Ciencias Sociales, Fondo de Cultura Económica, 
México, 1979, pp. 154-230. 
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4. La confiabilidad de la escala que implica a la vez su validez. Las varia- 
ciones que pudieran existir en el resultado final pudieren ser ocasionadas 
por variaciones en el sujeto, en el instrumento de medición o en ambos. 


En general, las escalas que se utilizan en las ciencias sociales son de tipo 
nométrica (nominales y ordinales) y se transforman por medio de procedimien- 
tos estadísticos en intervalos equivalentes. Un problema que se da con esta con- 
versión es que en ocasiones, la hipótesis de distancias iguales de las escalas 
intervalares no es válida para algunos fenómenos y la interpretación de los análi- 
sis estadísticos correspondientes puede ser desvirtuada. 


3.15 DEFINICIÓN DE LA POBLACIÓN 


Es importante definir la población en estudio; es decir, quién se va a estudiar. 
Si la población en estudio es pequeña deben estudiarse todos sus miembros; 
pero si es grande, es conveniente escoger una muestra representativa con base 
en los siguientes cuatro criterios: 


1. Cuál es la población deseada como meta. Especificar los sujetos de 
quienes se desee obtener la información. 

2. Cuántos muestrear. El tamaño de la muestra es resultado de negociar o 
conciliar dos conceptos: a) la precisión, que requiere una muestra grande 
y b) las restricciones de costos que obligan a reducir la muestra. 

. Cómo entrar en contacto con los sujetos. Existen varios medios para 
establecer contacto con los miembros de la población bajo estudio, como 
contacto personal, por teléfono, por correo, etcétera, 

4. Cómo extraer de la población a los sujetos para la muestra. Es otra 
decisión que se ve restringida por el presupuesto; la aspiración de escoger 
los componentes de la muestra en forma completamente al azar (que es 
muy costosa y casi nunca se emplea) se ajusta a la realidad a través de 
métodos diseñados para asegurar que haya representación en grupos 
clave; por ejemplo, estratificados o por cuotas. 


w 


3.16 RECOPILACIÓN DE DATOS 


Aunque el investigador no haga físicamente la recopilación, debe mantenerse en 
contacto con las personas que la realizan a fin de controlar la calidad de los 
datos. Además debe obtener ideas que le ayuden a sintetizar los resultados y a 
imaginar e intentar procedimientos analíticos para cuando los datos estén 
disponibles. 

Es indispensable hacer una recopilación a modo de prueba antes de iniciar 
una muestra mayor, al menos, realizar la prueba entre un grupo de allegados al 
investigador, con lo cual el cuestionario puede sufrir correcciones y mejoras. 
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Además, es deseable una prueba piloto de 50 a 100 sujetos típicos, porque per- 
mitirá comprobar que el procedimiento funciona en los sujetos de la población 
deseable como meta. Si los datos no tienen variabilidad; si todos contestan en 
los mismos términos a una pregunta, no tendrá caso hacerla en el muestreo final. 


3.17 CAPTURA DE DATOS 


La información recopilada debe ser revisada a fin de validarla; posteriormente 
puede utilizarse un computador para procesar los datos. La captura de datos ha 
tenido un gran avance tecnológico, gracias a los avances de la informática que 
permiten utilizar scanners (lectores Ópticos), e incluso sistemas de recono- 
cimiento de voz. que hacen mas expedita la labor de ingreso de datos a los sis- 
temas que lo requieren, en lugar de utilizar el teclado. 


3.18 ANÁLISIS ESTADÍSTICO 


Las técnicas de análisis de la información que se utilicen dependerán en alto 
grado de la accesibilidad de programas especiales de computación y de la sofisti- 
cación del analista. En general, existen varias pautas generales que conviene 
enfatizar. Los fenómenos se pueden definir generalmente por medio de una o 
varias variables que dan un carácter de complejidad diverso a los análisis finales. 

Para poder establecer la consecuencia de la interpretación congruente es 
necesario que se establezca si el instrumental es para la determinación de una 
relación de causalidad o para la determinación de una prueba de una hipótesis 
preexistente. 

En ambos casos las herramientas por usar dependerán del tipo de informa- 
ción disponible. Por ejemplo, sí los datos son de tipo nominal y dentro de dos 
categorías, la información puede analizarse a través del uso de “variables arti- 
ficiales” o “dummy”, que requíere de un análisis especial. Es conveniente en 
este punto ver en general una breve descripción de las diversas técnicas que se 
utilizan para determinar relaciones causales o para la prueba de hipótesis. Las 
técnicas que analizan en forma muy sucinta se llaman técnicas de análisis mul- 
tivariado, debido a que trabajan con varias variables en forma simultánea. 

Existen paquetes estadísticos que permiten una mayor versatilidad en el 
manejo y análisis de la información. Sin embargo, para este tipo de paquetes es 
conveniente conocer, aunque sea en forma somera, los posibles beneficios de su 
uso. Uno de los paquetes que más se conocen y utilizan es el SPSS (Statistical 
Package for Social Sciences)$. 

Entre las diversas técnicas, las que más se utilizan se presentan a conti- 
nuación como explicación de la figura 3.4. 


$ Nie N.H. Hull. 3.G. Jenkins, K. Steinbrenner y D.H. Bent, Staristical Package for the Social Sciences, Ed. 
McGraw-Hitl, 1975. 
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Como podrá verse, los métodos generales de análisis se clasifican de acuer- 
do con el objetivo que se persigue en su utilización. En primer término están los 
métodos orientados a determinar la relación de dependencia. Esta relación impli- 
ca que se presupone que una de las variables o varias de ellas, están dependiendo 
del comportamiento de una o varias a la vez. Por otro lado, las variables tienen 
una interdependencia y su variación se explica por la variación de las demás. 

En ambos casos, el tipo de escala que se utiliza en el instrumento de 
medición determina el método estadístico a utilizar. Como se verá más adelante, 
cada técnica estadística tiene un propósito diferente y específico.? 

Las técnicas estadísticas que más se conocen y utilizan son aquellas en las 
que la información obtenida es de tipo métrico (intervalar o racional), tanto en 
su aspecto dependiente como independiente; por ejemplo, cuando la variable 
dependiente del estudio es de tipo métrico, la regresión múltiple puede ayudar a 
encontrar y explicar la relación y la correlación entre las variables. 

La regresión múltiple consiste básicamente en determinar una función (por 
lo general lineal) en la que se “explique” el comportamiento de una variable lla- 
mada dependiente a través del comportamiento de otras variables (una o varias, 
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dependiente 
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9 Para mayor detalle de las diversas técnicas puede consultarse: Hair 3.F., R.F. Anderson, R.L. 
Tatham y B.J. Grablowsky, Multivariate Data Analysis, Pewroleum Publishing Company, 1979. 
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cuando es una sola variable se llama regresión simple) que forman la función 
correspondiente. La técnica de la econometría está encaminada básicamente a 
determinar los valores de los coeficientes que se derivan de cada variable. 

En el caso de la regresión múltiple se tienen que encontrar parámetros para 
cada una de las variables. Las técnicas son diversas y se pueden encontrar en la 
literatura especializada o en los manuales de los paquetes de computación como 
los ya mencionados. 

Una aplicación para ejemplificar sería tratar de explicar la relación exis- 
tente entre la cantidad demandada de un producto y la inversión hecha en los 
diversos medios publicitarios. Supóngase la existencia de tres medios alterna- 
tivos de comunicación que sean radio, televisión y cine. Estos medios colabo- 
raron al entendimiento o “concientización” de ciertos problemas o servicios 
que estén al alcance del auditor. La efectividad promedio de los medios se 
explica por medio de los diversos efectos presentados en estudios; con esta 
información se podría derivar una ecuación de regresión múltiple que tendría 
la siguiente forma: 


Mensaje = ay + a] (radio) + a, (televisión) + az (cine) 


Es decir, el impacto de los medios es diferente pero a la vez acumulativo. El 
valor de ag corresponde a la información básica mínima que cualquier persona 
posee, la contribución (que puede ser positiva o negativa) de cada medio corres- 
ponde al coeficiente que se le dé a cada variable. 

En los casos de correlación múltiple se trataría de ver cómo los diversos 
coeficientes existentes en diversas ecuaciones de predicción explican la 
variación en la variable dependiente. Por ejemplo, en el caso antes citado, intere- 
saría ver hasta qué punto la variación de la profundidad del mensaje se explica 
por la combinación de los tres medios de comunicación y por cada uno en lo 
individual. 

En los casos en que la variable dependiente es de tipo no métrica (medi- 
da en escala nominal u ordinal), la herramienta indicada para ver la forma de 
dependencia es la llamada análisis discriminante múltiple. Esta herramienta 
consiste en determinar ciertas fórmulas que indiquen cuál es la probabilidad 
de que cada una de las observaciones pertenezcan a un grupo determinado. 
En los casos correspondientes a técnicas concretas, existen varias y con 
resultados diversos. Una de las técnicas tradicionales es a través de maxi- 
mizar la distancia al cuadrado de los centroides. Otro método, menos común 
pero más fácil de comunicar, es el que se basa en la formulación de progra- 
mación lineal.!0 


10 Un ejemplo de esta explicación se da en: Ibarreche S. “Urilización del Ánalisis Discriminante 
para Concesión de Crédito”, Monografías Financieras IBAFIN, Vol. 1, No. 5. 1982. 
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En general, en este tipo de análisis se buscan los siguientes objetivos: 


. Determinar si existen diferencias estadísticas significativas entre los pun- 
tajes promedio de los diversos grupos bajo análisis. Estos grupos serían 
las categorías correspondientes de la escala nominal y la pertenencia a un 
grupo es determinada a priori. 

2. Establecer procedimientos para clasificar unidades estadísticas en gru- 
pos con base en su puntaje en diversas variables. En el análisis discri- 
minante se determina una función (o varias) cuyo puntaje define la 
pertenencia o no pertenencia de una unidad estadística a un grupo. Si la fun- 
ción es Z=wp + W] X1 +... + Wp Xy existe un grupo de corte que indica 
que debajo de dicho punto se pertenece a un grupo y arriba, a otro. 

3. Determinar cuál o cuáles de las variables independientes contribuyen más 

0 menos a la clasificación en los diversos grupos. 


Todos los objetivos mencionados se cubren en ambas metodologías (la de 
programación lineal y la tradicional) pero ta interpretación de los resultados 
debe ser cautelosa, porque en general existen variantes dentro del proceso del 
cálculo cuyos resultados pueden ser diversos. 

Cuando existen varias variables dependientes de tipo métrico, los análisis 
correspondientes se basan en el análisis canónico. 

El objetivo tanto del análisis múltiple de la varianza como del de covarianza 
es deteminar la existencia o no de diferencias entre grupos. 

Estas diferencias se explican mediante la hipótesis de igualdad de los vec- 
tores de medidas correspondientes. Las diferencias existentes pueden ser origi- 
nadas por diferencias entre los miembros de un mismo grupo, los grupos entre sí 
o una combinación de ambos. 

En los casos de análisis de varianza, la explicación de la variación total entre 
grupos se divide entre la variación entre los grupos que a su vez pueden explicarse 
por variaciones entre los diversos factores o entre cada factor individualmente. El 
resto de la variación se explica por medio de la variación en el grupo mismo. Esta 
variación se conoce como error estadístico. En los casos en que se desea un análi- 
sis más formal de los fenómenos se procede a analizar las fuentes del error. 

El análisis canónico es, en cierta forma, comparable con el análisis de corre- 
lación múltiple. Su diferencia fundamental es que en un caso se tienen varias 
variables dependientes, mientras que en el otro sólo una. En el caso del análisis 
canónico, la relación que mide el coeficiente de correlación es la existente entre 
dos grupos de variables y no, como en el caso de la correlación múltiple de una 
variable con un grupo. La fuerza de la relación de uno o varios conjuntos de 
variables es importante para el análisis de aspectos políticos que afecten a varios 
factores a la vez, 

Este análisis es poco popular por la dificultad que tiene en la interpretación 
de los resultados. Esta interpretación es compleja por la poca claridad concep- 
tual básica que tienen los diversos elementos que intervienen en este análisis. 
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Cuando existen varias variables dependientes no-métricas, el análisis de 
correlación canónica es más complejo aún, porque las variables correspon- 
dientes a los diversos grupos se sustituyen por las correspondientes variables 
artificiales o “dummy”. Estas variables son dicotomías que se representan 
numéricamente por medio de valores de uno, en el caso de pertenecer a una cate- 
goría, y valores de cero en el caso contrario. Para cada sujeto existirán tantas 
variables artificiales como existan en el diseño original, menos una. La razón del 
“menos una” es que en el caso de tener todos los valores en cero, debe 
pertenecer al grupo no considerado en las demás variables. 

Los análisis de interdependencia se utilizan primordialmente para estudios 
de tipo exploratorio. Algunas de las preguntas que se hacen en el mercado en 
general se “prueban” a través de este tipo de análisis. Por ejemplo: ¿qué varia- 
bles comunes existen en el comportamiento de los grupos que usan anticoncep- 
tivos? Este tipo de estudios suelen considerarse como de extrema satisfacción y 
requieren hasta cierto límite de una preparación estadística algo avanzada para 
su mejor comprensión. 

Para efecto de este capítulo se darán algunos conceptos básicos de las diver- 
sas herramientas, sin entrar en una profundidad que pudiera crear mayor con- 
fusión. 

Las tres técnicas básicas mencionadas en la figura 3.2 son: el análisis facto- 
rial, el análisis de conglomerados o “clusters” y el análisis llamado escalamiento 
multidimensional que se puede usar con datos métricos y no métricos. 

El análisis factorial es una herramienta que permite “crear” nuevas variables 
que correspondan a las originales pero que tengan, en número menor, una 
capacidad mayor de explicación de los fenómenos. 

El análisis factorial suele hacerse como un análisis discriminante. Su 
validez es lo que se conoce como parsimonia, es decir, la reducción del número 
de variables. El diseño del análisis factorial puede ser en forma exploratoria o 
confirmatoria. En el segundo caso, el análisis se basa en probar que existen fac- 
tores previamente establecidos como hipótesis. En el primero, el análisis trata de 
encontrar qué factores existen en la estructura de variables y cómo explican la 
variación original. La forma de determinar cuántos factores tomar, depende del 
análisis en sí y de la explicación de los diversos valores en forma tal que exista 
una congruencia y una explicación suficiente entre las variables originales y 
aquéllas resultantes del análisis. 

El análisis de conglomerados o “clusters” se basa en el estudio tendente a 
encontrar variables homogéneas y tratar de encontrar una o varias representati- 
vas del conjunto original. Este análisis es útil para segmentar mercados. Por 
ejemplo, permite ver qué elementos del mercado son comunes a un área geográ- 
fica o a un grupo de individuos que interesa, en un momento dado, estudiar. 

La técnica de escalamiento multidimensional o “mapping” consiste en crear 
un espacio que represente la distribución de los elementos bajo análisis, en 
forma tal que se puedan determinar los faltantes o huecos. La creación de 
huevos satisfactores en dichos huecos puede proporcionar un producto o servicio 
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que haga más sencillo el acceso al mercado de nuevos consumidores. Esta técni- 
ca ya se ha empleado en estudios de tipo político, para tratar de localizar en una 
escala la actitud política de diversos elementos de decisión y cómo se manejan 
por los diversos diputados norteamericanos (6) y para otras áreas de mercadotec- 
nia social. El autor realiza un estudio para ver la forma en que se percibe en el 
espacio familiar de las zonas indígenas estudiadas el uso de los diversos méto- 
dos de control natal. 

Todas las técnicas mencionadas implican un conocimiento de sus elementos 
y una actitud cauta en la interpretación de los resultados del análisis, de forma 
tal que se consideren siempre las premisas bajo las cuales se consideran las 
hipótesis básicas de cada una de las diversas técnicas. 

El proceso de reconciliar resultados con las concepciones preliminares es 
muy interesante. Siempre que el análisis de los datos entre en conflicto con las 
ideas preconcebidas, es natural la inclinación a dudar de la validez de los datos 
del análisis o ambos. Esta es una reacción sana puesto que innumerables sesgos 
y errores en el análisis pueden deslizarse en el estudio, tanto en lo conceptual 
como en la programación de la computadora, 


3.181 Conclusiones 


El último paso de un proceso de investigación bien ordenado es obtener la 
interpretación de los análisis y llegar a conclusiones. El valor expost de las 
conclusiones depende de qué tan bien ayuden a resolver el problema. 
Lamentablemente, a veces las investigaciones llegan a la conclusión de que: 
a) el problema necesita modificarse; b) los datos no estan dirigidos al proble- 
ma; c) que se necesita más investigación. 


3.18.2 Comentarios sobre el proceso descrito 


Este proceso consiste en una serie de pasos lógicos que ocurren en secuencia. En 
la práctica, el enfoque es más una meta que una realidad. En primer lugar, la 
secuencia se ataca en forma iterativa con la definición del problema, la estipu- 
lación de hipótesis, la selección del tipo de estudio, la definición del muestreo y 
el plan de análisis, consideradas todas estas fases casi simultáneamente. Sin 
embargo, esto último, impuro en el sentido académico, puede dar buenos resul- 
tados; lo que puede ser desastroso es alterar la secuencia de las fases. 


CAPÍTULO 


4 


Diseño de la investigación cuantitativa 


4.1 INTRODUCCIÓN 


Antes de empezar la investigación es recomendable anotar los pasos que ésta 
sigue; determinar tanto el costo como el tiempo que se necesita en cada etapa; 
especificar cómo van a realizar cada etapa y quién será el responsable. En otras 
palabras, para considerar la investigación como un proceso administrativo muy 
importante es necesario planificar; entonces, el diseño de la investigación es el 
plan que se usa como una guía para recopilar y analizar los datos. 

No hay un diseño estándar para realizar una investigación. No se debe 
esperar hasta que se encuentre un diseño perfecto. Así como en la construcción 
existen varios tipos de planos y éstos estan divididos en modelos especiales, en 
la investigación existen ciertos tipos clásicos de planificación para elaborar una 
investigación científica. 

En este capítulo se explica la importancia del diseño de la investigación y 
los principales tipos de diseño. 


4.22 LA IMPORTANCIA DEL DISEÑO DE LA INVESTIGACIÓN 


El diseño de la investigación es un programa que especifica el proceso de 
realizar y controlar un proyecto de investigación, es decir, es el arreglo escrito y 
formal de las condiciones para recopilar y analizar la información, de manera 
que combine la importancia del propósito de la investigación y la economía del 
procedimiento. 

Como implica la definición, el diseño de la investigación consiste en dos 
distintos aspectos: 
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1. El diseño es como un plan sistemático, o una serie de instrucciones 
para realizar un proyecto de investigación, tal como un plano de cons- 
trucción. 

2. El diseño implica dinero, recursos humanos y tiempo, es decir, controla 
presupuesto y tiempo del proyecto. 


Usar un diseño formalizado y escrito aumenta la probabilidad de que la 
investigación proporcione la información deseada para tomar decisiones. La 
información debe ofrecer precisión, actualidad, suficiencia, disponibilidad y re- 
levancia (ver primer capítulo, La característica de la información). Es posible 
realizar una investigación sin un diseño formal, pero la posibilidad de incum- 
plimiento y problemas durante el proceso de la investigación es alta. Realizar 
una investigación sin un diseño formal es como construir un edificio sin un 
plano de construcción, con lo cual es posible que el edificio resulte más caro, 
que se termine en más tiempo y que además no se parezca a lo que el constructor 
visualizó o pensaba en un principio. 

Algunos investigadores en el área administrativa están en contra del diseño 
formal de la investigación, debido a que: 


1, Se pierde el tiempo en el diseño; es mejor dedicar este tiempo a realizar 
el proyecto de la investigación. 

2. El diseño reduce la flexibilidad de las decisiones del proyecto de investi- 
gación. 


Ninguno de estos razonamientos es correcto. El diseño permite evaluar va- 
rías alternativas antes de realizar el proyecto. Además, crea mayor seguridad en 
lo que se va a hacer, ahorra tiempo y da mayor flexibilidad porque obliga al 
investigador a prever posibles eventos inesperados. 

Además, un diseño formal y escrito aumenta la comunicación entre admi- 
nistrador (gerente) e investigador y permite evaluar el proyecto. 


4.3 TIPOS DE DISEÑ 


Hay varias clasificaciones del diseño de investigación a las que un investigador 
puede enfrentarse: 


+ Diseño exploratorio-descriptivo. 
Diseño experimental y ex-post factor. 
+ Diseño histórico. 

+ Diseño de encuestas por muestra. 
Diseño exploratorio-causal. 

Diseño exploratorio-conclusivo. 
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La razón por la cual el autor se limitará a explicar sólo los tres diseños más 
conocidos (exploratorio, descriptivo, casual), es que los demás diseños mencio- 
nados sólo causan confusión, sin ofrecer mayores aportes, ya que todos son 
agrupables en alguno de los tres diseños expuestos, El diseño de una investi- 
gación es un concepto complejo que es difícil explicar. 


4.4 CRITERIOS PARA CLASIFICAR UN ESTUDIO 


Hay por lo menos siete perspectivas que se pueden utilizar para clasificar un 
estudio: 


4.4.1 El grado en que el problema de la 
investigación ha sido entendido 


Un estudio puede ser exploratorio o formalizado. Esencialmente, la diferencia 
entre estos dos tipos de estudio es el grado de estructuración y sus objetivos inme- 
diatos. El estudio exploratorio tiene una estructura débil y pone menos atención 
en ciertos objetivos predeterminados. En efecto, la idea de un estudio explorato- 
rio es desarrollar informaciones para estructurar una hipótesis por probar o crear 
algunas preguntas para hallar más información. Los estudios formalizados tienen 
una mejor estructura debido a que empiezan con hipótesis, procedimientos, 
fuentes precisas y son específicos en cuanto a los detalles. 

El estudio exploratorio es la etapa inicial. El mayor énfasis en este tipo de 
estudio es descubrir ideas y ampliar perspectivas respecto al problema en estu- 
dio, Suponga que la participación de mercado de un brandy X, ha disminuido; 
¿por qué? Esta descripción es tan amplia que puede servir como guía para la 
investigación. Para especificar y tener una amplia idea se debe de realizar una 
investigación (estudio) en donde el énfasis estaría en las explicaciones tentativas 
de la baja de las ventas. Estas explicaciones tentativas o hipótesis, servirán como 
guías específicas para un estudio formal (descriptivo). Supóngase que se sabe 
que el brandy X es fuerte y se bebe en reuniones sociales. En el estudio formal 
se entrevista a personas que asisten a reuniones sociales con más frecuencia si se 
quiere saber si les gusta el brandy fuerte o suave. 


4.4.2 El enfoque dei tópico del estudio (estudio estadístico, 
estudio del caso) 


El estudio estadístico difiere del estudio del caso en varios aspectos, aunque no 
siempre es muy clara la línea entre los dos. El estudio del caso pone más énfasis 
en el análisis completo de un número limitado de condiciones y sus interrelacio- 
nes. El estudio estadístico, en cambio, está más relacionado con sus condiciones 
en un punto y aborda procesos e interrelaciones que deben ser “inferidos" de los 
hallazgos estadísticos. 
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Un buen ejemplo que puede explicar lo anterior son las actividades para 
investigar los problemas entre el administrador y los trabajadores. Una encuesta 
en una fábrica entre administradores (gerentes de diferentes departamentos) y 
los trabajadores, puede proporcionar información que se puede tabular, encon- 
trar porcentajes, frecuencias y hasta cruzar los datos para encontrar relaciones 
entre variables como: condiciones de los trabajadores, actitudes de los traba- 
jadores, estilo de administradores, etcétera. 

Si la investigación se realizó como un estudio del caso que examina sólo 
unos departamentos y se estudiaron las actitudes de los trabajadores y adminis- 
tradores con varias perspectivas; es decir, que a varios miembros de cada depar- 
tamento se les entrevistó y se puso énfasis en las relaciones que podrían afectar a 
las actitudes de los miembros de ambas partes. 


4.4.3 El medio ambiente de la iny 


Esto significa que se deben clasificar los estudios si se realizan en condiciones 
ambientales "naturales” o en aquellas en las cuales las condiciones son artifi- 
ciales o simuladas, Es decir, se distingue entre “campo” y "laboratorio", aunque 
la distinción no siempre es muy clara. 

La simulación se utiliza cada vez más en la investigación, así como la simu- 
lación de situaciones, por medio de modelos matemáticos. 


4.44 La dimensión del tiempo 


Algunos estudios se realizan de una sola vez; otros se llevan a cabo por perío- 
dos. Estos últimos se conocen como estudios longitudinales. 

La ventaja obvia de estos últimos es que la investigación detecta los cam- 
bios a través del tiempo. Otra ventaja es que el investigador puede estudiar a la 
misma gente en períodos distintos o usar diferentes medidas según el tema, en 
cada oportunidad. 

Un estudio longitudinal típico es el famoso método "panel”, en Mercado- 
tecnia, donde un grupo de personas previamente seleccionadas y controladas 
reportan su consumo en ciertos productos, opinan del producto, precio, plaza y 
promoción. 


4.4.5 La forma de comunicación con el objeto de estudio 


Esta clasificación distingue entre procesos de control y de interrogación. De los 
primeros se citan los "observacionales", donde el investigador espera las activi- 
dades de un sujeto o la naturaleza de algunas materias sin intentar provocar res- 
puestas de alguien. Ejemplo: contar el número de automóviles que pasan en una 
intersección u observar las acciones de un grupo en la toma de decisión, son 
ejemplos de control. 
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Los estudios de tipo observacional pueden ser participativos. En éstos, el 
investigador tiene un papel importante, junto con otras unidades del estudio, o 
puede ser no participativo. Entre los segundos, el caso más común es la encues- 
ta. Un estudio de este tipo puede clasificarse según el medio de comunicación, 
encuesta por correo, por teléfono o entrevista personal. 


4.4.6 Control de variables 


Un concepto de investigación idealizado es lograr el “experimento” en que se pue- 
dan controlar las variables. El diseño experimental es apropiado cuando se pien- 
sa probar que algunas variables afectan a otras en cierta forma. A la recopilación 
de evidencias por medio de experimentos se le considera como el soporte más 
poderoso para la prueba de hipótesis en este caso. 

El caso más común en que el investigador no controla las variables, es cuan- 
do está "limitado" a reportar sólo lo que sucede. Este tipo de estudio se conoce 
más en las Ciencias Sociales. 


4.4.7 Naturaleza de la relación entre las variables 


Esta clasificación distingue entre estudios descriptivos y estudios causales. A 
menudo, estos dos tipos se relacionan con los estudios experimentales por una 
parte y los estudios ex post factor por la otra. 

Si el investigador está preocupado por saber quién, qué, dónde, o cuánto, el 
estudio es descriptivo; por el contrario, si el estudio está relacionado con el por- 
qué, entonces es causal. 

Las investigaciones que usan estudios causales tratan de encontrar la expli- 
cación entre las variables; por ejemplo, por qué el índice de mortalidad en el 
norte de la ciudad de México es más alto que en el sur, pero es difícil usar un 
análisis experimental o sea un diseño causal. Para problemas de esta naturaleza 
se deberá diseñar un estudio de ex post factor, y encontrar la causalidad con 
cruzamiento de datos y correlaciones. 


4.5 INVESTIGACIÓN EXPLORATORIA 


El objetivo principal de la investigación exploratoria es captar una perspectiva 
general del problema. Este tipo de estudios ayuda a dividir un problema muy 
grande y llegar a unos subproblemas, más precisos hasta en la forma de expre- 
sar las hipótesis. Muchas veces se carece de información precisa para desarrollar 
buenas hipótesis. La investigación exploratoria se puede aplicar para generar el 
criterio y dar prioridad a algunos problemas. 

El estudio exploratorio también es útil para incrementar el grado de 
conocimiento del investigador respecto al problema. Especialmente para un 
investigador que es nuevo en el campo del problema. 
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El estudio exploratorio se puede utilizar para descifrar conceptos. Por ejem- 
plo, el administrador ejecutivo desea considerar algunos cambios en sus políticas 
de servicios, donde su idea es que como resultado de tales cambios se incremente 
la satisfacción de los distribuidores. 

En síntesis, los estudios exploratorios pueden servir para los siguientes 
propósitos: 


+ Formular problemas para estudios más precisos o para desarrollo de hi- 

pótesis. 

Establecer prioridades para futuras investigaciones. 

+ Recopilar información acerca de un problema que luego se dedica a un 
estudio especializado particular. 

+ Aumentar el conocimiento respecto del problema. 

+ Aclarar conceptos. 


Por lo general, el estudio exploratorio es apropiado para cualquier problema 
del cual se sabe poco, y puede ser un antecedente para un estudio profundo. 
Hay varios tipos de estudios exploratorios: 


4,5.1 Investigar en la literatura 


Una farma rápida y muy barata de recopilar información respecto a un problema 
es descubrir las hipótesis adecuadas e investigar en la literatura. Aprovechar la 
literatura puede incluir literatura conceptual, comercial e incluso algunas esta- 
dísticas publicadas. El estudio de la literatura a veces aporta ciertas ideas que 
pueden alcanzar nuestro estudio. 

Suponga que en su empresa las ventas están disminuyendo y esto le preo- 
cupa. Desde el punto de vista del estudio exploratorio usted analiza revistas y li- 
teratura comercial, para encontrar que el problema se debe a que la rama de la 
industria en que se encuentra la empresa tiene problemas, es decir, el problema 
es general para tal industria, Se deben realizar diferentes tipos de estudios con 
distintos objetivos si la participación del mercado de la empresa es alto, per- 
manece constante o está disminuyendo. 

La investigación en la literatura debe incluir datos de archivo de la empre- 
sa, análisis situacional de la empresa en el mercado de la bolsa de valores, et- 
cétera. 

El gran peligro de eliminar esta etapa de investigación es que se realice una 
investigación mal planeada. 


4.52 Investigar utilizando expertos 
Rara vez se encuentra publicado el conocimiento existente en una rama de nego- 


cio. Por lo tanto, será de gran ventaja y se puede recopilar mucha información si 
se entrevista a los expertos en el área de estudio. 
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Cuando se entrevista a alguien en la etapa de consultar a expertos se debe 
tratar de saber su opinión acerca del sujeto de la investigación y sus puntos de 
vista, Se busca saber ¿qué han hecho?, ¿qué han intentado aunque sin éxito?, 
¿qué cambios han ocurrido al sujeto de la investigación en el transcurso del 
tiempo?, ¿qué problemas o barreras existen para investigar tal sujeto?, ¿qué 
tienen quienes intervienen en la toma de decisiones en el ámbito donde se en- 
cuentra el problema del estudi cuáles son las prioridades de estudio de tal 
naturaleza?, y muchas preguntas similares. 


4.6 INVESTIGACIÓN DESCRIPTIVA 


La investigación descriptiva es una forma de estudio para saber quién, dónde, 
cuándo, cómo y por qué del sujeto del estudio. En otras palabras, la información 
obtenida en un estudio descriptivo, explica perfectamente a una organización el 
consumidor, objetos, conceptos y cuentas. Se usa un diseño descriptivo para 
hacer una investigación, cuando el objetivo es: 


1. Describir las características de ciertos grupos. Por ejemplo, con base en 
los datos obtenidos de los usuarios de ciertos servicios públicos se 
quiere desarrollar el perfil de usuarios, "porcentaje de usuarios”, res- 
pecto a factores demográficos y socioeconómicos. 

2. Calcular la proporción de gente en una población específica que tiene 
ciertas características. Por ejemplo, se quiere calcular la proporción de 
indígenas del grupo otomí que trabajarán en la industria automotriz. 

3. Pronosticar, por ejemplo, la venta para los próximos cinco años y usarla 
como base en la planificación. 


Un investigador no debe caer en la tentación de realizar un estudio des- 
criptivo con una idea vaga del problema del estudio pensando que sería intere- 
sante. Un buen estudio descriptivo presupone mucho conocimiento a priori 
acerca del sujeto bajo estudio. Se apoya en una o más hipotesis específicas. 
Estas especificaciones dirigen al investigador a una dirección específica. Un 
estudio descriptivo es diferente de un estudio exploratorio. Un estudio explo- 
ratorio se conoce por su flexibilidad, mientras que al descriptivo se le puede 
considerar rígido. 

Un estudio descriptivo puede ser simple, es decir, de una pregunta o hipóte- 
sis univariable; o complejo, si empieza en un estudio descriptivo con varias va- 
riables y nos lleva a estudios más complejos, como los causales. 

Ejemplo: suponga que nos interesa analizar las cuentas de ahorro de un 
banco, o determinar el perfil de los ahorradores. Quizá se debe localizar a los 
ahorradores en relación con las sucursales de dicho banco. En este caso, la pre- 
gunta sería ¿qué porcentaje de los ahorradores viven a cierta distancia de una 
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sucursal? Usando el formato de hipótesis se puede predecir dicha distancia di- 
ciendo: 40% de los ahorradores viven en una zona de 3 kilómetros desde la su- 
cursal del banco, 

Posiblemente se aseguran las informaciones respecto de la influencia de 
otras variables como: 


. Tamaño relativo de las cuentas de ahorro. 

. Número de cuentas abiertas en 3 meses. 

. Monto de actividad (número de depósito y retiro). 
. Número de cuentas de menores de edad. 


PBon- 


Los datos de cada una de estas variables pueden ser de gran utilidad para el 
gerente al tomar una decisión. Todavía será más interesante cuando se cruzan 
estos datos. Por ejemplo, al cruzar las variables de distancia a ciertas sucursales 
y grado de actividades de las cuentas, se pueden observar diferentes grados de 
actividades de las cuentas de una sucursal del banco con respecto de la distan- 
cia a la que viven los clientes. Un cruzamiento de datos de tamaño de cuenta y 
sexo de los clientes puede mostrar relaciones. Es posible que esta relación no 
implique relación causal en su sentido estricto. 

Por lo general, un estudio descriptivo es más complejo que el del ejemplo. 
Puede ser que el estudio descriptivo lleve a un estudio causal, como análisis de 
cuentas de ahorro, que muestre concentración de los ahorradores hacia una 
sucursal cercana. Suponga que se encuentra que las cuentas de los que viven 
cerca de la sucursal tienen más movimientos y mayores ahorros que los que 
viven lejos de la sucursal, que la encuesta de los ahorradores proporciona infor- 
mación acerca de la actitud, ciclo y estilo de vida, ingreso familiar y clientes 
actuales. La correlación de estas informaciones indica que las cuentas de ahorro 
de los mejores clientes tienen un saldo mayor que las mujeres viudas o solteras 
que viven solas y que las mujeres de mayor edad tienen un saldo mayor. 

Algunas de las informaciones sugirieron relación causal, por ejemplo co- 
relación entre la sucursal más cercana y la posibilidad de tener su cuenta de 
ahorro allá, ¿Por qué la gente quiere tener su cuenta de ahorro en la sucursal más 
cercana? Este tipo de preguntas permite desarrollar la hipótesis que lleva al 
investigador a cierta dirección. Por ejemplo, la hipótesis de nuestro caso de 
cuentas de ahorro, sería: 


1. Los que viven más allá de tres kilómetros de la sucursal son clientes que 
vivían cerca, cuando abrieron su cuenta de ahorro. 

2. Los clientes actualmente viven cerca de la sucursal pero por algunos 

motivos su domicilio no está dentro de un radio de tres kilometros. 

. Los clientes que viven lejos trabajan cerca de la sucursal. 

4. Los clientes que viven lejos, pero tienen cuenta en la sucursal, porque 
hubo una promoción en que algunos que viven lejos abrieron cuentas de 
ahorro aquí. 


pS 
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En la esencia de todas las explicaciones científicas existe una idea de causalidad, 
es decir, se espera que una variable independiente produzca ciertos cambios en 
la variable dependiente, así como en la dirección y magnitud especificada por la 
teoría. Sin embargo, en una observación donde cada vez que cambia la variable 
independiente cambia también la variable dependiente, no significa necesaria- 
mente que exista una relación de causa y efecto. Entonces, el saber que exis- 
te una relación entre dos variables no es suficiente para el responsable de tomar 
una decisión, por lo que es necesario ir más allá y determinar si el cambio en una 
variable es la causa o efecto del cambio en otra variable, 

Como indicó el profesor Blalock, si X es causa de Y, un cambio en X pro- 
duce un cambio en Y!, Se han dedicado abundantes trabajos y siguen dedicán- 
dose al estudio y análisis de las relaciones causales. Uno de los principales 
métodos que se han usado para tal efecto es el llamado análisis de vías, cuyo ob- 
jetivo es estudiar y demostrar hipótesis, alternativas o variables independientes 
alternativas y ayudar a probar conexiones e inferencias causales. 

Hay ciertas diferencias entre el pensamiento científico y el sentido común. 

Cuando se dice que X es él caso de Y, implica que si cambia X cambiará Y, 
mientras que desde el punto de vista científico X puede ser uno de los varios 
casos en que puede influir la variable Y. 

Otra diferencia entre el sentido común y el pensamiento científico es que el 
primero cree que la relación es determinística, mientras el segundo dice que la 
relación es probabilística. En otras palabras, el sentido común supone que para 
que X sea causa de Y, X siempre debe seguir a Y. Por otra parte, el pensamiento 
científico dice que X puede ser causa de que ocurra Y, si la ocurrencia de X hace 
que la ocurrencia de Y sea más probable. 

Finalmente, el pensamiento científico de causalidad establece que nunca se 
puede decir con certeza que X es la causa de Y, sino que siempre se hace la infe- 
rencia de que la relación existe. 

La investigación causal es más formal y requiere un conocimiento bastante 
amplio por parte del investigador de las variables relevantes y de la forma en 
que se efectúan mutuamente. 

La investigación causal tiene por objetivo proporcionar evidencia suficiente 
sobre la existencia de relaciones causales. Por lo general, este tipo de estudio se 
realiza por medio de diseños experimentales. 

El experimento es la forma idealizada del análisis causal. La razón por la 
cual el experimento tiene mayor posibilidad de proporcionar evidencia de cau- 
salidad entre dos variables, es el control de la situación de estudio que tiene el 
investigador. 


1 Blalock, Hibert, Causal inferences in nonexperimental research. Chapel Hill, University of Ca- 
rolina Press, 1964, p. 4. 
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El experimento se puede definir como una investigación científica en la cual 
el investigador manipula y controla una o más variables independientes y obser- 
va en la o en las variables dependientes. Entonces, un diseño experimental es 
aquél en que el investigador tiene control directo en por lo menos una variable 
independiente y puede manipular, por lo menos, una variable independiente.? 

Como se evidenció de la definición anterior, los componentes de un diseño 
de investigación consisten en: comparación, manipulación o control, Estos com- 
ponentes son necesarios para establecer que las variables independientes y 
dependientes están causalmente relacionadas. Estos tres componentes se expli- 
carán con mayor detalle. 

Una comparación es una operación requerida para demostrar que dos varia- 
bles están correlacionadas (asociación y covariación también se denominan corre- 
lación). 

Manipulación significa que como la noción de causalidad implica que si Y 
es causada por X, entonces un cambio inducido en X será seguido por un cambio 
en Y. 

El tercer criterio de causalidad (control) requiere que los otros factores se 
excluyan como explicaciones previas a la relación observada entre las variables 
de investigación. Se refiere a la interrogante de si la variable independiente, de 
hecho, causa la variable dependiente. 


4.8 EXPERIMENTACIÓN EN LABORATORIO Y EN CAMPO 


Por lo general, hay dos tipos de experimentos: experimentación en laboratorio y 
en el campo. Cada uno tiene ventajas y desventajas. El investigador debe cono- 
cerlos, por lo que es necesario definir ambos tipos de experimentos. 

La experimentación en laboratorio se puede definir como un estudio en don- 
de el investigador tiene que crear una situación artificial de la vida real, en 
donde controla algunas variables y manipula otras; donde él pueda observar y 
medir el efecto de la manipulación de las variables independientes en la variable 
dependiente en una situación en donde los efectos de otras variables hayan sido 
controlados. 

Por otra parte, el experimento en el campo se refiere a un estudio experi- 
mental en una situación real, en donde una o más variables independientes estará 
sujeta a manipulación bajo estricto control de otras variables de control. Esto es 
relativo hasta donde permita la relación del estudio. 

Hay gran diferencia entre estos dos diseños de experimento. El experimento 
en laboratorio tiene gran validez interna debido al control del factor que implica 
este diseño, mientras que el diseño de experimento de campo tiene gran validez ex- 


2 Fred N. Kerlinger. Foundations of Behavioral Research, Holt Reinebari and Winston, Nueva York. 
1973. p. 315, 
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terna, ya que, como se elabora en la vida real, puede detectar las posibles conse- 
cuencias externas del experimento. 


4.9 DISEÑO EXPERIMENTAL 


Antes de explicar qué es un diseño experimental se requiere conocer la termi- 
nología de diseños experimentales. Suponga que X sea la persona, el grupo, el 
producto, la organización, etcétera, que va a recibir el efecto o tratamiento de 
experimento. 


4.9.1 El diseño experimental clásico 


1. Se tienen dos grupos de personas, objetos, animales, etcétera con las 
mismas características (idealmente cada individuo sería igual a otro en 
cualquiera de los grupos). 

Antes de realizar el experimento se efectúa una pre-prueba, es decir, se 

mide la cualidad que se desea observar en el experimento (variable de- 

pendiente). 

3. A cualquiera de los grupos se le somete al tratamiento experimental 
(variables independientes). A este grupo se le llama grupo experimental, 
al otro, grupo de control. 

4. Se vuelve a medir la variable dependiente (post-prueba). 

Se evalúa la diferencia entre la pre-prueba y la post-prueba de cada 

grupo; si la diferencia del grupo sometido al tratamiento es significativa- 

¡mente mayor que la del grupo de control se deduce que la variable inde- 

pendiente está causalmente relacionada con la variable dependiente. 


» 


Es 


Grupo Asignación — Pre-prueba — Tratamiento  Post-prueba Diferencia 


Experimental — Aleatoria O x 0, 0-0=4) 
de control Aleatoria 0, O 04-03 =d> 


4.9.2 Inferencias causales 


+ Enel fondo de todas las explicaciones científicas está la idea de causali- 
dad; esto es, se espera que la variable independiente produzca un cambio 
en la variable dependiente en la dirección y la magnitud especificadas por 
la teoría. 

+ Como dice Blalock: “Si X es una causa de Y, pensamos que un cambio en 
X produce un cambio en Y, y no solamente que un cambio en X es segui- 
do o está asociado con un cambio en Y.” 
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+ Recordar el ejemplo en el que la presencia de más bomberos en un in- 
cendio iba siempre seguida de mayores daños. La causa no observada es 
el tamaño del incendio. 

+ La demostración de causalidad requiere tres operaciones: a) demostrar 
covariación, b) eliminar relaciones espurias, y c) establecer el orden en el 
tiempo de las ocurrencias. 


Covariación 


+ Covariación simplemente significa que dos fenómenos varían conjunta- 
mente, Por ejemplo: si un cambio en el nivel de educación está acom- 
pañado de un cambio en el nivel de ingreso, se dice que covarían. En la 
investigación científica la covariación se expresa con medidas de corre- 
lación o asociación. 

+ La correlación es una condición necesaria, pero no suficiente, para de- 
mostrar causalidad. 


Relaciones no espurias 


+ Una relación no espuria es una relación entre dos variables que no puede 
ser expresada por una tercera variable. En otras palabras, si se controlan 
los efectos de todas las variables relevantes y se mantiene la relación 
entre las dos variables, entonces la relación es no espuria. 

+ Una relación no espuria implica una relación causal entre las dos va- 
riables. 


Orden en el tiempo 


+ Es necesario demostrar que un fenómeno ocurre antes que otro. El su- 
puesto implícito es que los fenómenos en el futuro no pueden determinar 
fenómenos en el pasado o presente. 


4.93 Componentes de un diseño de investigación experimental 
El diseño clásico de investigación consiste de tres componentes: comparación, 
manipulación y control. La comparación permite demostrar covariación; la ma- 


nipulación ayuda a establecer el orden en el tiempo, y el control permite 
determinar si la relación es o no espuria. 


Comparación 


Una comparación es una operación para demostrar que dos variables están co- 
rrelacionadas. Un ejemplo común de correlación es el observado entre el cáncer 
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de pulmón y fumar; para esto se puede comparar la frecuencia de la ocurren- 
cia de cáncer entre fumadores y no fumadores. 


Manipulación 


La noción de causalidad implica que si X es causa de Y, un cambio en X será 
seguido por un cambio en Y. Se supone que las relaciones son asimétricas: una 
variable es la fuerza determinadora y la otra es una respuesta. Para que esto se 
establezca, el cambio en X tiene que ser antes que el cambio en Y. 


Control o validez interna de los diseños de investigación 


Se requiere eliminar otros factores como explicaciones alternas de la aso- 
ciación observada entre las variables en investigación. Los factores externos 
por controlar se refieren a posibles sesgos que pueden resultar en el proceso de 
selección; es decir, puede ocurrir que los grupos experimentales no sean 
homogéneos. Ejemplo: al comparar el efecto de otorgar nuevas viviendas a más 
familias pobres contra otras familias con las mismas características económicas 
que no recibieron vivienda nueva, se podría inferir que la nueva vivienda altera 
la conducta social, pero también se puede pensar que las familias que se cam- 
biaron eran intrínsecamente diferentes. Los factores internos por controlar se 
refieren a cambios en los individuos o unidades estudiadas que ocurren durante 
el experimento, cambios en el instrumento de medición o el efecto reactivo de la 
misma observación: 


l. Historia. Eventos ocurridos durante el estudio que pueden afectar a los 
sujetos estudiados y dar una explicación alterna al cambio de la variable 
dependiente. Por ejemplo, en un estudio para medir el efecto de la cam- 
paña de elección, la hipótesis podría ser que una campaña influye en la 
votación, pero eventos como conflictos gubernamentales e inflación 
pueden afectar la votación más que la propaganda. 

2. Maduración. Los procesos biológicos y psicológicos producen cambios 
en los individuos al paso del tiempo y pueden afectar la variable 
dependiente. Por ejemplo en exámenes a estudiantes entre una prueba y 
otra, se pueden volver más conocedores y maduros, lo que afectaría los 
resultados. 

3. Mortalidad experimental. La eliminación de sujetos de los grupos expe- 
rimentales y de control afecta las pruebas estadísticas. 

4. Instrumentación. Se denomina así a los cambios en los instrumentos de 
medición entre la pre-prueba y la post-prueba. Para evitarlo se debe 
mostrar que aplicaciones repetidas con el mismo instrumento bajo condi- 
ciones constantes dan los mismos resultados. 
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5. Reactividad de la prueba. El proceso de probar o medir puede por sí 
mismo cambiar el fenómeno por medir. El efecto de la pre-prueba 
puede sensibilizar a los sujetos y mejorar sus resultados en la post-prue- 
ba. Este es el caso del supervisor de la fábrica que cuando observa a sus 
trabajadores, éstos realizan mejor el trabajo. 

6. Efecto de regresión, Se le llama así porque en los casos extremos tiende 
a acercarse (“regresarse”) al promedio, Por tanto, si se experimenta con 
sujetos que fueron considerados los mejores o los peores de una po- 
blación, tenderán a dar resultados más cercanos al promedio en pruebas 
siguientes. 

7. Interacción con selección. Muchos de los factores internos analizados 
pueden interactuar con los externos (de selección) y afectar el expe- 
rimento. En general, se citan las interacciones selección-historia 
y selección-maduración. Por ejemplo, al comparar hembras contra 
machos puede ocurrir que la maduración de las hembras sea más rá- 
pida. 


4.9.4 Procedimiento de control 


Se utilizan dos procedimientos alternos para contrarrestar el efecto de los fac- 
tores externos. El primero, emparejamiento, controla las variables que el in- 
vestigador conoce antes del experimento; el segundo, aleatorización, ayuda a 
eliminar el afecto de factores no previstos. 


+ Emparejamiento. Se igualan los grupos experimental y de control en las 
variables relacionadas con la hipótesis de investigación. Hay dos mé- 
todos: emparejamiento preciso y distribución de frecuencia. Con el pri- 
mer método, para cada caso en el grupo experimental, se escoge uno con 
características idénticas para el grupo de control. Por ejemplo, si se to- 
mó un licenciado de 29 años para el grupo experimental se tomará otro 
licenciado de 29 años para el grupo de control. En el segundo método se 
igualan sobre promedios y varianzas de todo el grupo y no por individuo. 

* Aleatorización. Todos los sujetos disponibles se asignan aleatoriamente 
al grupo experimental o al de control. La aleatorización puede ser con 
una moneda, con la tabla de números aleatorios, o con cualquier método 
que garantice que cualquier sujeto tenga la misma probabilidad de ser 
asignado a cualquiera de los dos grupos. 


El grupo de control 
Permite controlar los factores internos, ya que éstos afectan tanto al grupo 


experimental como al de control, por lo que puede inferirse que la diferencia que 
exista entre los dos grupos se debe al entrenamiento. 
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Representatividad de la muestra 


Es necesario que los grupos representen fielmente a una población mayor si se 
desea generalizar las conclusiones del experimento. La aleatorización no garan- 
tiza la representatividad. Ejemplo: en un estudio se seleccionan voluntarios de 
una universidad. Los grupos no son representativos de esa universidad y menos 
de la población en general, debido a que los voluntarios exhiben característi- 
cas diferentes a los no voluntarios 


Representatividad del experimento 


En ocasiones, el experimento se realiza en laboratorios o en situaciones que no 
ocurren en la vida real, por lo que sus conclusiones no pueden generalizarse. 


4.10 TIPOS DE DISEÑOS EXPERIMENTALES 


Los diseños experimentales se clasifican de acuerdo con la manera como mane- 
jan los factores internos y externos ya analizados. Hay tres tipos de diseños 
experimentales: 


1. El diseño experimental clásico es el más poderoso. Permite compara- 
ción, control, manipulación y, normalmente, generalización. 

2. El cuasi-experimental típicamente excluye la manipulación y la aleato- 
rización. 

3. Los pre-experimentales son los más débiles, 


Diseño Salomón de 4 grupos: 


Pre-prueba Post-prueba 
Aleatorio 01 x 0, 
Aleatorio 0 Os 
Aleatorio x Os 
Aleatorio 0s 


Es una variante del diseño experimental clásico. Se agregan dos grupos no 
pre-probados a fin de eliminar el efecto reactivo del experimento. Tiene mayor ge- 
neralización y permite medir el efecto reactivo. Sin embargo, muchas veces es im- 
práctico o costoso. 


Diseño de grupo de control de post-prueba 


En inglés post-test-only control group design. Es una variación del diseño clási- 
co y del Salomón. Omite los grupos de pre-prueba. 
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Post-prueba 
Aleatorio Xx O 
Aleatorio Oz 


Controla todos los factores internos de error. Con la omisión de la pre-prue- 
ba, los errores de reactividad e instrumentación son irrelevantes. Los dos grupos 
son afectados por los mismos factores externos y maduran simultáneamente. 


Diseños experimentales para efectos de larga duración 


En los diseños anteriores se supone que el efecto del tratamiento se puede obser- 
var en un período corto. En muchas ocasiones no es así; por ejemplo, el efecto 
de programas educacionales en los países en desarrollo. Una solución es hacer 
varias post-pruebas. Esto es fácil en instituciones educativas. 

En otros casos, el efecto reactivo no permite repetir las pruebas por lo que 
se sugiere otro diseño. 


Pre-prueba Post-prueba Post-prueba 
Aleatorio O Xx 1972 
Aleatorio 03 O4 
Aleatorio Os Xx 06 
Aleatorio O; 0g 


Diseños factoriales 


En los diseños anteriores se consideró sólo una variable independiente. El diseño 
factorial permite considerar dos o más variables independientes actuando con- 
juntamente. 

Se requieren más grupos experimentales: uno para cada combinación de 
valores de las variables independientes. Por ejemplo, si se desea medir de alguna 
manera la moral de los empleados (Y, la variable dependiente) en empresas 
grandes o pequeñas (X, una variable independiente) con estructura centralizada 
o descentralizada (Z, otra variable independiente), entonces se requieren cuatro 
tratamientos: 


x = tamaño de empresa 
Grande Pequeña 


Central 1 2 
= Estructura 


e 


descentralizada 3 4 
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Nótese que hay cuatro tratamientos y, por lo tanto, cuatro grupos experi- 
mentales. Una gran ventaja de los diseños factoriales es que amplían la genera- 
lización, ya que en la vida real los fenómenos rara vez los usa un solo factor. No 
sólo se puede estudiar el efecto de los factores sino la interacción entre éstos. 


4.11 MODELOS ESTADÍSTICOS 
4.11.1 Diseño completamente al azar 


El diseño completamente al azar es el tipo más simple de diseño experimental. 
Se usa cuando interesa investigar el impacto de una sola variable. La variable se 
puede examinar en una o más diferentes dimensiones; como por ejemplo, tres 
diferentes precios en tres diferentes tiendas. 

Suponga que una cadena de supermercados en México quiere saber el efec- 
to de precio del producto X sobre la venta, usando tres diferentes precios: 129 
pesos, 139 pesos y 149 pesos. Se desea realizar el experimento en México, D.F. 
y área metropolitana. En el primer grupo de tiendas se vende el producto X a 129 
pesos el kilo, en el segundo grupo de tiendas a 139 pesos y en el tercer grupo a 
149 pesos el kilo respectivamente. El resultado de venta de tres grupos de tien- 
das durante ocho días de experimento eran los siguientes: 


ler, grupo 20. grupo 3er, grupo 
231 199 183 
182 236 185 
227 219 223 
194 205 236 
206 216 194 
198 135 216 
216 220 209 
211 192 185 


Análisis estadístico 


Se utiliza para el análisis estadístico de un experimento completamente al azar, o 
sea, para probar que si las variaciones de precio de 10 pesos por cada kilo de 
producto x, influye en la cantidad de venta; en otras palabras: 


Ho: U = Us =U3 
B4: No todas las medidas son iguales. 


Para probar esta hipótesis se tendrá que realizar el análisis de varianza. Se 
usa el análisis de varianza para descomponer la varianza total, que es el resulta- 
do de los diferentes tratamientos y error experimental. 
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Se realiza el análisis de varianza para calcular la estadística de F. (Fis- 
cher), donde se compara este F. con una F, de la tabla. Para calcular F, de la 
tabla se necesitan dos factores: el grado de libertad y el nivel de significancia 
(a); se busca en la tabla donde cruzan el grado de libertad de tratamiento y el 
grado de libertad de error, con el nivel de significancia que desea el inves- 
tigador. Se debe mencionar que cuando el número de replicaciones no es el 
mismo para cada tratamiento se utilizan diferentes cálculos para encontrar la 
estadística F, por medio de la tabla de ANOVA 

Para calcular la estadística F, se utiliza la tabla de análisis de varianza 
(ANOVA); ver la tabla siguiente: 


Tabla de ANOVA para el diseño completamente al azar (caso balanceado). 


Fuente de Grado de Suma de Cuadrados 
variación libertad cuadrados medios Fe 
A A 
Tratamiento t-1 Y Xelr=e | Y XPIr=e CMTR 
a $ CMER 
$51 
Error t(r-1) SCTL — SCTR SCER 
tr 
n 
Total rt 1 Y Xp e 
Añ 
rf  = número de tratamiento 
r = número de repeticiones por tratamiento 
xj  = total del -ésimo tratamiento 

SCTL = suma de cuadrados totales 

SCTR = suma de cuadrados de tratamientos 

SCER = suma de cuadrados de errores 

CMTR = cuadrados medidos de tratamiento 

CMER = cuadrados medidos de error 
€ = factor de corrección =G?/rr 


donde G = S y Xi 
ci ja 
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Regla de decisión 

Si F¿ es mayor que F,, entonces se rechaza H,, y se concluye con cierto nivel de 
confianza (a) que no todas las medias son iguales. Si F. es menor que F,, no se 
rechaza H,, y se concluye con cierto nivel de confianza que algunas de las me- 


dias no son iguales. 


Solución del ejemplo: 


B de 
> X 1665 Xx; 208 Para el precio 
E 129 
3 dl 
S x, 1672 X; 209 Precio 139 
A 
Sx 1631 Xx 204 Precio 149 
E 
Factor de correlación 
C=G2/n 
= (1665 + 1672 + 16317 /(3)8) 
= 1028 376 


Suma de cuadrados del total (de todas las observaciones) 


Moe 


3 
SCTL = Xf-0 
A 


17 


(231) + (182Y + ... + (185)? — 1028 376 
6856 


Suma de los cuadrados de los tratamientos: 


3 
SCTR = Y XPlr=c 


= [(1665)? + (1672)? + (1631)91/(8 — 1028 367) = 8 
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Suma de los cuadrados de los errores: 


SCER = SCTL — SCTR 


= 6856 - 8 
= 6848 
Fuente de Grado de Suma de Cuadrados Fo 
variación libertad cuadrados medios 
Tratamientos 2 8 4 81.5 
Error 21 6848 326 
Total 2 6856 
CMTR = 812 =4 P.=326/4 
CMER = 6848/21 P.= 81.5 


2 y 21 grados de 
libertad 


No rechazar Ho Rechazar Ho 


Nota: Cuando se tiene un diseño completamente al azar, desbatanceado, es decir, cuando el número 
de replicaciones no es el mismo para cada tratamiento, todo el proceso es igual que el caso balan- 
ceado, excepto que en el cálculo del grado de libertad de error sería n — £, y el grado de libertad to- 


tal sería n — l. 


Figura 4.1 
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Conclusión 


Con un nivel de significancia (a = 5% y 2 y 21 grados de libertad se encuentra 
el valor de la tabla F, = 3.47; como F, = 81.5 y F, = 3.47, se rechaza H,; es 
decir, la variación de precio influye en la cantidad de venta del producto x. 


4.112 Diseño de bloques aleatorios 


En el ejemplo del experimento de precio, uno puede percatarse de que el resulta- 
do del diseño completamente al azar puede ser sesgado si al seleccionar las tien- 
das, todas las tiendas grandes quedan en el primer grupo, y todas las tiendas 
pequeñas en otro grupo. Esta situación puede hacer que el resultado varíe. 

Lo que debe hacer el investigador para controlar este posible sesgo, es 
aplicar el diseño de bloque aleatorio. 

El diseño de bloque aleatorio requiere que las unidades de investigación se 
dividan en bloques. Hacer estas divisiones requiere del uso de algunos criterios 
externos; debe haber tantas unidades del estudio en cada bloque como tratamien- 
tos; entonces el tratamiento de tres precios requiere de tres tiendas en cada tres 
bloques; se dividen las tiendas en tiendas grandes, medianas y chicas, según su 
tamaño, número anual de compradores o venta anual. Suponga que la compañía 
GIGANTE dividió sus tiendas con base en el volumen de venta anual como se 
indica a continuación: 


1. Tres tiendas en que su venta anual es superior al promedio del primer 
bloque. 

2. Otras tres tiendas en que su venta anual es igual al promedio del segundo 
bloque. 

3. Tres tiendas más en que el promedio es inferior al promedio del tercer 
bloque. 


Como se vio en este ejemplo, el tamaño de la tienda fue lo que determinó 
los bloques. Ahora, a cada tienda en cada bloque se le asignará uno de los tres 
precios aleatorios, y se hará lo mismo con cada grupo experimental. 

Se aplicará el ejemplo de precio simbólicamente. Como hay tres tratamien- 
tos (tres precios): P, = 129, Pa = 139 y Pz = 149, debe haber tres bloques, y en 
cada bloque deben haber tres tiendas, y a tres tiendas de un bloque se les asigna 
aleatoriamente un tratamiento (un precio). Un posible resultado de esta asigna- 
ción podría ser: 


Unidad experimental en bloque 
il 2 3 
P3 Pa P, 
Pa Pr PI 
Ps Pz Ps 
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Suponga que las ventas del producto x después de cierto tiempo aplicando estos 
experimentos son las siguientes: 


Tratamientos | Bloquel | Bloque! | Bloquelll 


Pr 915 900 890 
Pa 935 880 860 
P3 920 920 880 


No interesa encontrar si existen algunas diferencias en la venta del producto 
x aplicando diferentes precios. 
Para probar esta hipótesis se requiere realizar un análisis de varianza. La 


tabla y las fórmulas para calcular diferentes elementos de este análisis son los 
siguientes: 


Tabla ANOVA para diseño de bloques aleatorios. 


Fuente de | Grado de Stmas Cuadrados 
variación | libertad cuadradas medios Estadística 
Tratamiento 1-1 Y Xélr=e CMRT= .= ¡CMIR, 
El CMBL 
SCTR/(— 1D 
Bloques o r-1 Y Xpl=e CMBL= 
repeticiones 4 SCBLI(r — 1) 
Error te — DG = 1)| SCER = SCTL — CMER = 
(SCTR — SCBL) | SCERM: — 1Xr — 1) 
Total ”n-1 XP=c 
AA 
Donde 


x;¿ es la observación de variable de respuesta medida en el ¡-ésimo trata- 
miento y j-ésimo bloque. 


Xjes la suma de observaciones en ¡-ésimo bloque, o sea Xuj 


; 


> As 


X¿ es la suma de observaciones en ¡-ésimo tratamiento, o sea Xi 
ql 
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Xx; = media de tratamiento ¿ 
Xx; = media del bloque j 
€ = coeficiente de corrección = re 
ñ £ 
donde x... =Y y X= 2 X= Xx 
1 j=1 i=l ¿=1 
X= xo brt 
Solución de nuestro ejemplo 
Tratamiento| Bloques Suma x; Media x; 
1 u tu 
P; 915 900 890 2705 901.7 
P> 935 880 860 2675 891.7 
Py 920 920 885 2725 908.3 
SUMA X, 2770 2700 2635 8105 
MEDIA X; 923.3 900 878.3 900.53 
E A O O O 


c=x...(r) 
244% 


1» 


2 x? 


zx? = 


SCTL 


SCTR 


= (8105) / [(3X3)] = 7 299 003 


= (915)? + (900) + (890) + (9357 + (8807? + (860)? + 


(920) + (920)? + (885)? = 7 303 575 
= (2705P + (2675)? + (2725)? = 21 898 275 


(2770Y + (2700) + (2635)? = 21 906 125 


= (21898 275/3)- 7 299 003 = 422 
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A 
SCBL = 2 X?li=e 
= (21906 125/3) — 7299 003 = 3039 
SCER = SCTL — (SCTR — SCBL) = 4572 — (422 + 3039) = 111 
CMTR = SCTR/(t— 1) =42213 — 1) =211 
CMBL = SCBLI(r-— 1) =3039/(3 — 1) = 15195 
CMER = SCER/[G— DF 1] = 11/(G— DG D] =1111/4 
= 277.15 
F. = CMTR/CMER = 211/277.75= 76 
Fuente de Gradode |  Sumade Cuadrados Fe 
variación libertad cuadrados medios 
Tratamientos 2 422 211.0 76 
Bloques 2 3039 1519.5 
Error 4 111 277.75 
Total 8 4572 


El F¿ de la tabla con 2 y 4 grados de libertad y en a = 5% es = 6.94, como F¿ es 
menor que F,, no se rechaza la H,, es decir, el precio no influye en la venta del 
artículo x con 95% de confiabilidad. 


4.113 Diseño experimental de diseño factorial 


Para realizar una auditoría se desea investigar el efecto de utilizar dos diferentes 
métodos (a, y a2) a dos diferentes tiempos de proceso (b¡ = 2 horas, bz = 4 
horas) sobre el rendimiento, el tanto por ciento de la eficiencia, es decir, la 
variación de respuesta X. 

El diseño experimental elegido fue el de tres bloques aleatorios. Los resulta- 
dos son los siguientes: 


B = tiempo de proceso de la auditoría 


bi = 2 horas bz = 4 horas 
70 $0 
a 68 76 
A = método de 74 72 
auditoría 76 70 
a 68 82 
6 68 
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Solución: 
Total para el 
efecto factorial 
A = método de -1 ! -1 1 [4] = -12 
auditoría 
B = tiempo -1 1 1 1 [B] = 28 
procesado 
AXB= 1 -1 1 1 [AX B]=-4 
interacción, 
métodos y 
tiempo 
Las sumas de cuadrados son: 
SC = (-129/4x3=12 
SCg = (28%/4Xx3= 65.33 
SCaxe = (-49/4x3=1.33 


Se calculan las sumas de cuadrados. 


C=X1r4 


SCTR 


SCBL 


SCTL 


(868? / 12 = 62785.33 


7 r 2 2 2 2 

eo EA 200) 
Añ 3 

62785.33 = 78.67 

1 2 4 2942 + 2782 
$ x2..104-C= (296? + 294? + 278%) _ 
A 3 

62785.33 = 48.67 

2 2 2 

Y Y Y Xi? C= 707 + 68? + 742 + 80? +76? + 


+72 +76? +68? + 642 + 702 
+ 822 + 68? — 62785.33 = 318.67 
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SCER = SCTL-— SCTR — SCBL 
SCER = 318.67 — 78,67 — 48.67 
SCER = 191.33 
Tabla de ANOVA 
Fuente de variación gl cm F 
Tratamientos 3 


A = Métodos de auditoría 1 


B = Tiempo en proceso 


AX B = Interacción 


SCTR _ 78.67 


CMTR = -— = == =26.22 
(=D 3 
SCBL 48.67 
CMBL = —— = 24,33 
(r-1 2 
SCER 191.33 
CMER = + —— == = 31,88 
(r-D(04—1) 6 
Tabla de medias y errores estándar 
bi =2 horas — bz=4horas Efecto simple Efecto principal 
au 70.66 76 5.34 
a 69.33 4.00 4.67 
Efectos simples — 133 - 267 
Efecto principal -2 


En la tabla de ANOVA y la tabla de medias se observa que el rendimiento de los 
métodos de auditoría depende de su tiempo de proceso. El tiempo de proceso 
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(b1 = 2 horas) no es el adecuado para los dos métodos de auditoría, y al aumen- 
tar el tiempo de proceso se obtiene un mejor rendimiento en a; y en 22. 


4.11,4 Diseño experimental de cuadro latino 


Una empresa cigarrera desea conocer la satisfacción de sus clientes, para lo cual 
presenta los siguientes resultados: 


Marcas 
Segmento de 
mercado A B c D 
1 4 ] +1 0 
un 1 Úl =1, 2 
tu 0 0 -3 =2 
Iv 0 -=S -4 -4 


Nota: se utilizaron números positivos para mayor satis- 
facción y números negativos para insatisfacción del 
consumidor. 


Elaboración del cuadro latino 


Segmentos de mercado 
Posición E 4 m l qY Suma Media 
1 ci Dz a.0 B-5 -8 2 

z E -2 = 
2 B 1 C-1 D-2 J Aa.0 HA | 0.5 
3 Á Boi CN D-4 2 0.5 
4 Ul D A 1 BOO C-4 -=3 0.75 
Suma 4 =1 0 -13 =15 
Media J 0.25 -125 -3.25 0.9375 

Zl 
r=4 1=4 
2 
CE o 
16 


Ma 
Ms 
E 

$ 


ED 2 + (4)? = 95 
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A 
Y XP = (824 (29 4 (2 + (39 = 81 
i=1l 
Y XP = A IA ES 13 = 212 
A 
SCTL = X¡? - C=95-— 14.06 = 80.94 
SCTR = XP /(r-0)= = —14.06 = 6.19 
212 
SCBL = EXP 1010) = EF —14.06 = 38.94 
SCER = SCLT — (SCTR + SCBL) 
SCER = 80.84 — (6.19 + 38.94) = 35,81 
CMTR = SCTR/(-1)= en = 2.06 
CMBL = SCBL/(r—1)= EA = 12.98 
CMER = SCER/(t— 1r=1)= == = 3.98 
20.6 
= = Te 50517 
Fo = CMTRICMER = = qe 
Tabla de análisis de varianza 
GL $.C. CM. F.C. 
Tratamientos 3 6.19 2.06 0.517 
Bloques 3 38.94 12.98 
Error 9 35.81 3.98 
Total 15 90.94 


El valor de F, con un nivel de significancia + 5% y 3 y 9 grados de libertad 


es F,= 3.86. 


Como F. es menor que F, se acepta la hipótesis nula H,. 


H.;: No existe diferencia significativa en la satisfacción de clientes (segmen- 
tos de mercado I, II, III, IV) de cigarrillos y en las marcas (A, B, €, D) selec- 


cionadas. 


CAPÍTULO 


5 


Sesiones de grupo 
(Focus Group) 


5.1 INTRODUCCIÓN 


En este capítulo se explicará una técnica realmente nueva én los países hispanos 
y frecuentemente usada en el área de investigaciones relacionadas con la 
Administración de Empresas, Esta nueva técnica se llama Sesiones de Grupo 
(Focus Group) o Grupos de Discusión. En este capítulo se describe el origen, la 
definición, metodología, ventajas, desventaja, cuándo y cómo se debe utilizar, 
así como recomendaciones para obtener un buen resultado al aplicar este tipo de 
estudio. 

A nivel profesional es muy poca la gente que no ha participado alguna vez 
en un grupo de discusión. Hay grupos de planificación, grupos de discusiones 
sobre tema libre, grupos que discuten problemas personales, como la terapia de 
grupo, muy utilizada en psicología; grupos de toma de decisiones, etcétera. 
Todos hemos participado alguna vez en un grupo de discusión, A veces, sin pro- 
ponérnoslo, nos encontramos en un grupo que está debatiendo o discutiendo 
sobre algún tema; otras veces, conscientemente participamos en uno. Estos gru- 
pos de discusión pueden tener diversos objetivos; en una empresa puede ocurrir, 
por ejemplo, que los empleados: 


+ hayan perdido el rumbo con el cual fue diseñada la producción; 
+ hayan olvidado cuáles son los objetivos de su trabajo; 

+ no reflejen lo planeado en el desarrollo de su trabajo; 

+ simplemente necesiten de una nueva dirección; 

+ sean informados de los planes y el futuro que tiene la empresa; 
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+ conozcan cuál es la idea, la opinión y la imagen que el cliente tiene de la 
empresa. 


Éstas y muchas otras razones son las que nos hacen reunimos para discutir 
una gran variedad de temas. ¿Qué tan exitoso será el resultado de un grupo de 
discusión? Esto depende de que los objetivos planteados sean cumplidos y de 
que la persona que esté dirigiendo la sesión lo haga de una manera satisfactoria 
para el cumplimiento de éstos. 


5.2 DEFINICIÓN 


Una sesión de grupo es una reunión en la que participan de 10 a 12 personas que 
se encuentran en una sala y platican sobre cierto tema previamente establecido. 
El grupo será conducido por una persona a quien se denomina “moderador”, 
cuya función es, basándose en una serie de objetivos bien definidos, dar inicio a 
Ya señón y Gra discusión vuscando que los dbjetivos establecidos se cum- 
plan. Las sesiones de grupo son muy populares y frecuentemente utilizadas en 
los Estados Unidos, Canadá y Europa. Las sesiones de grupo, mejor conocidas 
en Estados Unidos como focus group, frecuentemente se utilizan para conocer 
ideas, opiniones o actitudes hacia ciertos productos, servicios, aspectos políticos, 
de organización, evaluación de anuncios publicitarios, evaluación del impacto 
que podrían tener los anuncios antes de mandarlos al aire, conocer la opinión 
acerca de la imagen de ciertas instituciones, conocer la preferencia del consumi- 
dor acerca del empaque o envoltura de ciertos productos, diseños de las etique- 
tas, probar el producto y opinar acerca del sabor, del color, del olor y muchos 
temas más. 


5.3 ¿CÓMO SURGIÓ LA NECESIDAD 
DE LLEVAR A CABO 
SESIONES DE GRUPO? 


En la década de 1930 a 1940 los investigadores en ciencias sociales tuvieron la 
inquietud de cómo hacer para entender mejor a la gente. Los estudios se realiza- 
ban a través de un cuestionario que, en muchas ocasiones, los entrevistados no 
respondían satisfactoriamente. 

Las encuestas escritas tienen muchas limitaciones debido a que el formato 
que se utiliza es, algunas veces, demasido formal, y las preguntas en los cues- 
tionarios en general son cerradas, Cuando hay una pregunta abierta, para efectos 
de estadística tiene que codificarse y eso muchas veces no representa el sen- 
timiento de la persona entrevistada. Cuando la respuesta tiene que ser cerrada, el 
encuestado tiene que estar de acuerdo sólo con determinadas respuestas. Por 
ejemplo: 
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¿Por qué tiene usted su cuenta bancaria con el Banco del Atlántico? 


1. Está cerca de mi oficina. 

2, Está cerca de mi casa, 

3, Un familiar trabaja en ese banco. 

4. Los servicios de ese banco son muy buenos. 

5. Los estados de cuenta de ese banco son fáciles de entender. 

6. Los intereses que proporcionan son mejores que en otros bancos. 
7. Resuelven los problemas del cliente amablemente. 


El encuestado tiene que contestar una o más de las opciones; es decir, su 
respuesta tiene que ser forzosamente bajo el cuadro mencionado y no puede 
expresar su opinión personal. 

La segunda limitación que a los investigadores les preocupaba era cómo 
eliminar la influencia del entrevistador en las respuestas del entrevistado. 

La tercera preocupación del investigador era evitar que el entrevistador omi- 
tiera cierta información durante la entrevista. Los investigadores trataron de 
encontrar una técnica en la que el entrevistado pudiera dar su opinión libremente 
acerca del tema en estudio. Primeramente pensaron en realizar una entrevista 
cara-a-cara de una manera informal, como una conversación, Sin embargo, poco 
a poco encontraron algunas limitaciones en esta técnica y empezaron a formar 
un grupo y platicar sobre ciertos temas. Durante la Segunda Guerra Mundial se 
utilizó esta técnica para entender el grado de firmeza y de conciencia personal de 
los soldados; después usaron sesiones de grupo para elevar su estado de ánimo. 
En los últimos 50 años el uso de sesiones de grupo ha aumentado a tal grado que 
diariamente se realizan miles en los Estados Unidos y otros países. 


5.4 EL USO DE SESIONES DE GRUPO 


Se ha encontrado que esta técnica es primordial para realizar una investigación, 
pues además de que se ahorra tiempo y dinero es muy importante cuando se trata 
de tomar una decisión final. Las sesiones de grupo se utilizan en el área de nego- 
cios, mercadotecnia, publicidad, psicología, pedagogía, estudios sociales y en 
agencias gubernamentales. 

De acuerdo con la experiencia de Market Study International (compañía 
especializada en estudios de mercado, en particular del mercado hispano en los 
Estados Unidos), aproximadamente el 65% de las sesiones de grupo se realizan 
para empresas privadas y 35% para organizaciones públicas (gubernamentales). 

Es importante decir que el focus group no siempre es un estudio representa- 
tivo de la población, ni es una técnica científica que permita cuantificar los 
resultados. Por tanto, a esta técnica de estudios también se le conoce como méto- 
do cualitativo. Sin embargo, el uso de esta técnica es crucial. En algunas oca- 
siones, antes de realizar un estudio grande (cuantitativo), se conducen ciertas 
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sesiones de discusión (focus group) para entender mejor el problema y definir 
las variables del estudio apropiadamente; en ocasiones para entender la opinión 
general de la gente acerca de ciertos productos o servicios, así como de la publi- 
cidad, empaque o simplemente para probar el producto. 

Con las sesiones de grupo se puede entender mucho mejor la opinión, per- 
cepción, actitud y conocimiento de la gente acerca de programas sociales y 
gubernamentales, así como también de productos y servicios. 

Los participantes en una sesión de grupo deben ser personas que tengan 
ciertas características similares, pero que no se conozcan entre sí. En una sesión 
de grupo, además de lograr los objetivos del estudio, también se pueden conocer 
varios elementos que no es posible entender o identificar por medio de otras téc- 
nicas de investigación; por ejemplo, ¿cómo influye la opinión de una persona en 
la decisión de otras? 

Somos el producto de nuestro medio ambiente, y estamos influenciados 
por la gente que nos rodea. Un investigador hábil o un moderador con expe- 
riencia, puede, a través de la observación del comportamiento de los partici- 
pantes y las preguntas que ellos mismos se formulan, indagar cuánto influye la 
opinión de ciertas personas en las decisiones de las demás; quiénes son los 
líderes de opinión dentro de un grupo social, qué miembro de la familia es el 
más influyente en la decisión, así como establecer cuál es el grado de lealtad 
que tiene cierto grupo de personas hacia determinadas preferencias, midiendo 
la frecuencia con que cambian de opinión influenciados por otro(s) miem- 
bro(s) de la sesión, 

Por lo general en las encuestas no es posible detectar este fenómeno, porque 
el investigador influye en la forma de contestar del encuestado, y en cómo puede 
expresar su opinión, percepción, actitud y sentimiento. En una sesión de grupos, 
en cambio, el investigador puede indagar más sobre las respuestas y entender la 
razón que las motiva. A través de las sesiones de grupo también es posible des- 
cubrir características personales de cada uno de los participantes. 

La gente por lo general se presenta de tal forma que exagera lo que es, eleva 
sus valores y falsifica algo de información para poder quedar bien ante los 
demás; sin embargo, la idea de las sesiones de grupo es que la gente sea franca y 
exprese exactamente la realidad de su pensamiento. Para algunas personas 
expresar su forma de pensar es difícil; para otras resulta muy fácil y natural; los 
niños, por ejemplo, tienen una tendencia natural de expresar lo que piensan sin 
ninguna alteración; pero poco a poco, en el transcurso de su crecimiento, apren- 
den a no expresarlo, sino según el medio ambiente en el que se encuentren y 
aprenden que deben cuidarse de lo que dicen. 

También hay ocasiones en las que uno da a conocer su forma de pensar, por 
ejemplo, a un compañero de travesía en un viaje relativamente largo. Este tipo 
de revelaciones ocurre por diferentes razones: cuando las personas tienen algo 
en común o simplemente por el hecho de saber que quizá nunca se vuelvan a 
ver. En una sesión de grupo se pretende crear un medio ambiente tal que los par- 
ticipantes expresen sus ideas y sentimientos libremente. Cuando los partici- 
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pantes sienten esa bertad, su participación es activa y el moderador sólo debe 
controlar la discusión, evitando que derive del tópico de estudio. 


5.5 CÓMO ES EL FOCUS GROUP (SESIONES DE GRUPO) 


Como antes se definió, una sesión de grupo tiene dos partes fundamentales: el 
grupo y el director del grupo o moderador, también es necesario hablar acerca de 
la sala de sesiones del grupo. 

Por lo general, el grupo debe estar formado por entre $ y 12 personas con 
características similares, las cuales absolutamente no deben conocerse entre sí. 
El investigador define cuáles son las características que deben tener los partici- 
pantes; por ejemplo: demográficas, de consumo de ciertos productos o servicios, 
familiares, etcétera. Para controlar esto se elabora un cuestionario para la selec- 
ción y el reclutamiento de las personas a la sesión de grupo llamado screener. 
Utilizando este cuestionario y usando técnicas aleatorias se escoge a la gente que 
puede ser entrevistada para su posible participación en la sesión de grupo, una 
vez que reúnan las características indicadas en el cuestionario de reclutamiento, 
Así pues, se invita a las personas apropiadas a la sesión de grupo, En la parte 
final de este capítulo se tratará, en un caso real, cómo se definen los objetivos 
del proyecto, y de acuerdo con éstos, la elaboración de la guía de discusión; 
quiénes participaron y cuál fue el resultado de la sesión. 

El objetivo principal de las sesiones de grupo no es obtener números, como 
frecuencias, porcentajes, etcétera, sino que es un estudio cualitativo, es decir, un 
estudio para conocer las características personales y las opiniones de cierto 
grupo de personas en un ambiente completamente natural en el que los partici- 
pantes expresan su forma de pensar libremente, además de contestar las pregun- 
tas que el moderador formula, quien con su experiencia y conocimientos analiza 
las respuestas, las discusiones, los puntos de vista y el comportamiento de los 
participantes para poder entender su actitud profundamente. En algunas circuns- 
tancias el moderador puede predecir cuales serían Jas respuestas o decisiones 
que algunas personas podrían dar a ciertas preguntas. Como vimos anterior- 
mente, hay que considerar los siguientes aspectos. 


5.5.1 Tamaño del grupo 


El tamaño del grupo no debe ser muy grande, a fin de que todos tengan la posi- 
bilidad de hablar y discutir su punto de vista con el grupo sin que el moderador 
corra el riesgo de perder el control. Por lo general, el grupo de entre 8 y 12 per- 
sonas es ideal, ya que de esta forma se tiene la cantidad de participantes nece- 
saria para que todos puedan aportar sus puntos de vista en la discusión. Rara vez 
un moderador acepta más de 12 personas en una sesión, porque sería difícil con- 
trolarlas, ya que si a una persona no se le da oportunidad de expresar su opinión, 
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empieza a hablar con la persona que tiene al lado. Cuando el grupo es demasiado 
grande, los participantes no tienen tiempo de discutir el tema, por lo que no 
escuchan a los otros participantes, y solamente expresan su opinión personal, El 
grupo no debe tener menos de ocho participantes, porque si es muy reducido no 
proveerá suficiente información para satisfacer las inquietudes del proyecto. 


5.5.2 Similitudes entre los participantes 


Los participantes deben tener características similares, y deben conocer el tema 
en estudio. Vamos a suponer que el objetivo es medir el grado de conocimiento 
de la gente respecto del SIDA; por lo tanto, los participantes deberán ser sexual- 
mente activos, tener determinada edad, y cierto nivel social o de educación. En 
este caso los grupos de mujeres tienen que ser separados de los de hombres; 
incluso, el moderador tiene que ser hombre o mujer dependiendo del grupo de 
que se trate, con el fin de evitar inhibiciones por parte de los(las) participantes. 
Otro ejemplo puede ser el indagar cuáles son las causas de problemas entre ado- 
lescentes. Debemos entonces tener un grupo de adolescentes separado del grupo 
de padres que tengan un hijo adolescente. Otro ejemplo puede ser el conocer 
cuál es Ja opinión que tiene la gente acerca de los cigarrillos Benson $: Hedges. 
Hay que invitar a personas que fumen cierta cantidad de cigarrillos al día y que 
sean mayores de 18 años. 


5.5.3 Los participantes no deben conocerse 


Los participantes en una sesión de grupo no deben conocerse ni debe existir 
relación alguna entre ellos, simplemente debido a la confidencialidad de opi- 
niones, sentimientos, hábitos, etcétera. Mucha gente se siente incómoda con la 
presencia de alguien que conoce y no le es posible expresarse libremente, espe- 
cialmente cuando se traten temas delicados, El moderador no puede obtener 
información confiable de un grupo en el que haya participantes que se conozcan. 
Por tal razón uno de los principales requisitos del reclutamiento para sesiones 
del grupo es que los participantes no sean amigos, parientes o conocidos. 


5.5.4. Propósito de seguridad 


El cuestionario de reclutamiento siempre debe tener algunas preguntas llamadas 
“de seguridad”, para descartar a posibles participantes si, por ejemplo, tanto 
ellos o miembros de su familia fuesen empleados de alguna agencia de estudio 
de mercado, de publicidad, o que estén relacionados con los productos o servi- 
cios cubiertos por el proyecto en estudio, así como otras preguntas de seguridad 
que el investigador decida formular. 

Generalmente se pueden lograr mejores resultados cuando el grupo de par- 
ticipantes tiene características demográficas similares, pero opiniones variadas 
acerca del tema en estudio, 
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5.6 LA SALA DE SESIONES 


Por lo general para poder realizar las sesiones de grupo, las instalaciones 
requieren de lo siguiente: una sala de juntas (conferencias), en la que 12 per- 
sonas puedan sentarse cómodamente alrededor de una mesa diseñada para con- 
ferencias, con el moderador a la cabecera de la mesa, para poder ver a todos los 
participantes. Junto a la sala de juntas debe haber una sala de observación en 
donde hasta ocho personas puedan observar el desarrollo de la sesión. La 
división entre estas dos salas debe ser de un vidrio/espejo de una sola dirección, 
de tal forma que las personas en la sala de observación puedan observar, sín ser 
vistas, a los participantes de la sesión en la sala de juntas. 

La sala de juntas debe tener micrófonos colgados del techo para transmitir 
la voz a la sala de observación y a los aparatos de audio y video. Es muy impor- 
tante que la sala de juntas tenga un pizarrón y accesorios para colgar materiales 
de apoyo. Además, debe existir una cámara en la que pueda ser filmada la 
sesión. Esta cámara debe estar instalada detrás de la sala de juntas; es decir, en la 
parte superior junto al vidrio de la sala de observación con el fin de que se tenga 
un mejor campo visual, ya que el hecho de que los participantes no puedan ver 
la cámara ayuda a que no se distraigan. 

Existen algunas empresas que ofrecen la transmisión de la sesión en vivo 
vía satélite a la oficina de los clientes, En muchas ciudades o países las empresas 
de investigación de mercado no están acostumbradas a hacer este tipo de estu- 
dio, quizás por la gran inversión en instalaciones que se requiere. Sin embargo, 
estas sesiones pueden realizarse en un hotel, en salones públicos, en escuelas; 
básicamente, en cualquier lugar en donde haya dos cuartos: uno destinado como 
sala de juntas y el otro como sala de observación y, mediante un circuito cerra- 
do, observar la sesión. También se pueden llevar a cabo instalando una cámara 
de video (que esté en la sala de juntas) conectada a un monitor y a una 
videograbadora (deben estar en la sala de observación) para poder observar y 
escuchar los comentarios y opiniones de los participantes. 


5.7 EL MODERADOR/DIRECTOR DE GRUPO 


Como se mencionó antes, al director del grupo se le denomina “moderador”, y 
es la persona que dirige la conversación hacia el logro de los objetivos plantea- 
dos previamente. El moderador debe ser una persona inteligente, hábil, con una 
preparación universitaria, con experiencia y conocimiento del tema, para diri- 
gir la conversación y hacer sugerencias a la compañía que requiere del estudio 
para poder tomar decisiones acertadas. El moderador además debe tener caris- 
ma y adaptabilidad a las características del grupo, así como liderazgo en su 
conducción. 
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5.7.1 Educación 


Un moderador debe ser un investigador. Alguien que sepa conducir estudios 
científicos, es decir, que conozca diversos métodos de investigación, o que al 
menos tenga experiencia trabajando como asistente de un investigador en el área 
de humanidades, como comunicación, mercadotecnia, psicología, trabajo social, 
ciencias administrativas y/o pedagogía. 


5,7.2 Experiencia 


Moderar un grupo no es solamente sentarse con el grupo a hacer preguntas y 
obtener respuestas. El moderador debe tener experiencia dirigiendo grupos de 
discusión y obteniendo conclusiones que sean valiosas para entender el proble- 
ma o el tema de estudio. El moderador debe formular una guía para la sesión, y 
saber cómo motivar a la gente para que participe activamente durante ella. 

La experiencia se logra en la realidad, conduciendo o moderando grupos. 
Tal vez al lector le surja la interrogante: ¿cómo puede una persona actuar como 
moderadora de un grupo, si nunca antes lo ha hecho? Es factible que si una per- 
sona ha trabajado como asistente de un moderador, observándolo, y a veces dis- 
cutiendo después de la sesión ciertas tácticas que el moderador haya empleado, 
logra entender las técnicas involucradas, Moderando grupos como práctica le 
proporcionará experiencia y le permitirá que poco a poco él(ella) desarrolle su 
propio estilo de moderar. El moderador debe tener experiencia y habilidad de 
moderar grupos de ambos sexos (damas y caballeros). 

Un moderador que haya trabajado con una variedad de grupos y partici- 
pantes de diferente nivel cultural, educacional y de edad sabe que en los países 
industrializados, especialmente en Estados Unidos, es muy difícil controlar gru- 
pos formados por adolescentes (teenagers). 

El moderador deberá ser autoritario con ellos y no permitir que se 
aprovechen de él; deberá también incluir, si es posible, a unas dos personas adi- 
cionales en el grupo para poder retirar de la reunión a aquellos que sean difíciles 
de controlar o que sean participantes con poco respeto. Para sacar una persona 
durante la discusión por razones disciplinarias, porque no participa o porque el 
moderador detecta que no es apropiada para el grupo, él deberá salir de la sala y 
decirle a la secretaria del grupo que remueva de la sala a la persona X diciendo 
que alguien lo busca o lo llama; una vez fuera, proceder a pagar el monto acor- 
dado por su colaboración y despedirse muy gentilmente. 


5.7.3 Conocimientos 


El moderador debe tener suficientes conocimientos acerca del tema de dis- 
cusión. Debe conocer el producto, servicio o problema que se está investigando 
y entender los objetivos del estudio. Los conocimientos del tema se pueden 
adquirir hablando con el cliente, leyendo artículos y folletos acerca del objeto en 
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estudio. El moderador debe examinar o probar el producto, si es que es un pro- 
ducto el sujeto de conversación, así como conocer muy bien el servicio o 
cualquier cosa que se esté examinando. Esto se logra en un tiempo relativamente 
corto, por medio de entrevistas con los que encargaron el estudio, observando, 
leyendo y hasta platicando con expertos; pero es crucial que el moderador tenga 
conocimientos no sólo para poder responder preguntas, sino para poder conducir 
al grupo con eficiencia. El moderador debe tener una experiencia y actitud posi- 
tiva, lo que conducirá al logro del propósito de la sesión de grupos. 


5.7.4 Personalidad 


El moderador debe tener una personalidad agradable, con cierto carisma y habi- 
lidad de comunicación. Su personalidad debe ser tal que los participantes se 
sientan cómodos. Una persona balanceada no debe ser seca ni autoritaria, ni por 
el contrario actuar como un comediante o payaso; sino que debe ser una persona 
muy tranquila y natural. Debe vestirse acorde con el tipo de participantes; por 
ejemplo, en una sesión entre mecánicos acerca de herramientas fabricadas por la 
firma X, no es prudente que el moderador se ponga su mejor traje, corbata y 
demás, sino que debe vestirse con una indumentaria mucho más sencilla. 


5.7.5 Liderazgo 


El moderador debe tener la presencia y habilidad de liderar al grupo. Tiene que 
dirigirlo y guiarlo, no permitir que los participantes hablen con quien tengan al 
lado, que hagan otras cosas o que no presten atención a l:1 dinámica de grupo; ni 
tampoco que intenten dominar al grupo tratando de influir sobre lo otros en que 
nada más lo que diga él(ella) es lo correcto. Para lograr un buen liderazgo al 
dirigir los grupos, los siguientes puntos son de mucha utilidad: 


5.7.6 La presentación inicial del grupo 


Durante la presentación inicial del grupo, el moderador tiene que hablar muy 
seriamente, explicando la razón de ser de la reunión, presentarse a sí mismo y 
decir cuál es su trabajo o profesión. Además el moderador debe aclarar algunas 
normas de la reunión, como decirles a los participantes: 


“Estamos aquí para platicar acerca de...; por favor hablen, expresen sus opinio- 
nes; aquí no hay preguntas o respuestas correctas o incorrectas; aquí cualquier 
idea, opinión y sugerencia es realmente bienvenida. Además, me ayuda per- 
sonalmente a entender mejor este tema y a poder escribir un reporte mucho 
mejor, También les pido que por favor absolutamente no hablen con la persona 
de al lado. Si tienen preguntas o desean agregar un punto de vista en cierta dis- 
cusión levanten su mano; yo les daré el derecho de palabra. Por favor no hablen 
más de uno a la vez; escuchen lo que está diciendo su compañero para poder 
participar en la discusión” 
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Es importante que el moderador recuerde los nombres de los participantes 
para poder llamarlos por su primer nombre. Por esta razón, hay que escribir el 
nombre de cada participante en un rótulo y colocarlo frente de cada uno, Otra 
opción es simplemente colocarles un gafete (name tag). Al inicio del grupo los 
participantes deberán presentarse entre ellos. Esto ayuda a que los participantes 
se conozcan y adquieran la familiaridad necesaria para que la sesión se desen- 
vuelva con soltura. 


5.8 EL ASISTENTE DEL MODERADOR 


El asistente del moderador es por lo general una persona que trabaja en la 
empresa que está realizando el estudio y participó en la selección y reclutamien- 
to de los participantes. Su responsabilidad es la siguiente: 


+ Como supervisor de reclutamiento, asegurarse de que los participantes 
cumplen con los requerimientos. 

+ Verificar que hay suficientes participantes en cada grupo. 

+ Cerciorarse de que todos los participantes saben cómo llegar y están con- 
firmados a la hora. 

+ Avisar al moderador del estado en que se halla el reclutamiento de partici- 
pantes. 

+ Revisar las instalaciones de la sala de juntas y de observación, para asegu- 
rarse de que todos los aparatos de grabar y filmar funcionan, Esto debe 
hacerse un día antes o temprano en el día de sesiones, para que, si hay que 
reparar algo, se haga antes del inicio de las sesiones. 

+ Colocar en la sala papel, lápices y otros materiales que requiera el modera- 
dor para el grupo 

+ Recibir a los participantes y hacer sus tarjetas y rótulos de identificación. 

+ Atender a participantes y clientes (observadores) con botanas (snacks) y 
refrescos. 

+ Asegurarse de que los observadores o clientes sean realmente quienes 
deban estar en la sala de observación. Por razones de seguridad debe tener 
una lista de quiénes van a estar en la sala de observación y pedir tarjetas 
de identificación para asegurarse de su identidad. Esto evita que alguien 
espíe el procedimiento. 

* Atender al moderador durante la sesión del grupo, trayendo recados de los 
observadores al moderador. 

+ Atender a los observadores para asegurarse de que están bien servidos y 
no les falta nada. 

* Verificar periódicamente que la grabación se está realizando correcta- 
mente. 

» Atender a los participantes al terminar la sesión para pagarles el monto 
convenido por su participación. 
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+ Sacar las cintas grabadas junto con el screener. Entregarlas al moderador 
al término de las sesiones. 


5.9 PREPARACIÓN DE LA GUÍA DE DISCUSIÓN 


Antes del inicio del focus group, el moderador debe tener una guía de discusión, 
esto es, qué preguntas e inquietudes le planteará al grupo y qué asuntos necesita 
discutir. Para la preparación de esta guía es recomendable que tanto el cliente 
como el moderador trabajen en su redacción, ya que así pueden asegurarse de 
que todos los aspectos del proyecto han sido cubiertos. La guía no debe ser una 
serie de preguntas y respuestas (como un cuestionario), porque de ser así, la dis- 
cusión se convierte en una especie de clase de escuela. La conversación tiene 
que incorporar la contribución de todos los participantes; es decir, que las pre- 
guntas en la guía tienen que ser abiertas, diseñadas para promover la plática y 
estimular el pensamiento del grupo. La guía no es en realidad un cuestionario, 
sino una especie de notas para recordar al moderador asuntos que él deberá men- 
cionar al grupo. El moderador, conocedor de lo delicado de algún asunto, puede 
cambiar la forma de preguntar o de iniciar la discusión y, de acuerdo con su 
experiencia, sabrá iniciar la conversación respecto a ideas y temas delicados. La 
guía debe además tener en cuenta el nivel educativo y cultural de los partici- 
pantes. 

La guía de discusión tiene que ser revisada por diferentes personas en dis- 
tintos departamentos de la empresa que de alguna manera trabajan en el caso, 
para asegurarse de que todos los aspectos han sido bien pensados. La guía de 
discusiones tiene que reflejar los objetivos del estudio. 


5.10 JUNTA PREPARATORIA DE SESIONES 


Antes de empezar la sesión, el moderador, el responsable del proyecto (investi- 
gador) y el cliente deben reunirse a discutir la logística de la sesión. Deben ase- 
gurarse de que el moderador tiene suficientes conocimientos del producto o del 
servicio, y de los objetivos que se persiguen con las sesiones. Es obvio que el 
moderador no puede ser un conocedor de todos los campos que se deseen inves- 
tigar, que tampoco conozca todos los negocios ni todas las organizaciones; esto 
no es necesario. Sin embargo, es importante que antes de liderar un grupo en 
una sesión, se le impartan al moderador suficientes conocimientos acerca del 
producto, la organización, los servicios que presta, las dificultades, y la razón 
por la cual consideraron necesaria la realización de las sesiones de grupo, Es por 
lo tanto responsabilidad del jefe del proyecto de la organización, asegurarse de 
que el moderador entiende el trabajo de la empresa y algo del sector industrial al 
que la empresa pertenezca, En esta reunión preparatoria es crucial que el mode- 
rador consulte todas las dudas que tenga y aclare asuntos como, por ejemplo, 
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aparatos audiovisuales y otros materiales que necesite para moderar los grupos, 
Particularmente cuando la sesión tiene como objetivo evaluar conceptos publici- 
tarios, el moderador y el director de arte de la empresa tienen que reunirse antes 
de las sesiones de grupo, para que afinen todos los detalles del concepto, los 
cartelones publicitarios, cómo aparecerán o cómo se filmarán. Todos los aspec- 
tos deben estar claros para el moderador; incluso, de ser necesario, el moderador 
puede hacer una presentación preliminar actuada, para el cliente y los encarga- 
dos del departamento de creatividad y arte para aclarar dudas y asegurarse de 
que todo está comprendido. 

El moderador y cliente también tienen que hablar respecto a las interrup- 
ciones de la sesión con mensajes de probing (sondeo). Se acostumbra que 
durante la sesión los observadores manden mensajes para el moderador 
escribiéndole acerca de áreas sobre las que desean que el moderador indague 
más. Hay moderadores a quienes no les gustan las interrupciones hasta finalizar 
la sesión de grupo; a otros les gusta que los interrampan para poder hacer alguna 
indagación específica a tiempo. En cualquiera de estos casos, lo importante es 
que exista un acuerdo previo. 


5.11 CÓMO CONDUCIR AL GRUPO 


El grupo empieza después de que el moderador haya evaluado los cuestionarios 
de las personas que ya han llegado para la sesión, y se haya asegurado de que 
sus calificaciones son las apropiadas y esperadas. Si llegan más de 10 personas, 
el moderador tiene que escoger a aquellos que le parezcan más apropiados para 
los fines del grupo, y eliminar al resto, aunque deberá pagar a todos aquellos que 
hubieren sido reclutados y estuviesen allí. 

Con 8 a 12 personas se forma el grupo. Todos los participantes, antes de 
ingresar a la sala de discusiones, deben portar gafetes (nametags) preparados por 
la secretaria del grupo, con sus respectivos nombres escritos en letras grandes y 
legibles desde lejos. Una vez en la sala, y habiéndose ubicado los participantes 
en los lugares de su preferencia alrededor de la mesa, el moderador saluda y se 
presenta; por ejemplo: 

“Buenas tardes/Buenas Noches. Mi nombre es Rafael Mendoza; yo seré el 

moderador de este grupo. Soy un asesor independiente; no estoy ligado de 

ninguna manera a...(asunto/producto/servicio a tratar), que es el tema del que 
vamos a platicar hoy. Por favor siéntanse tranquilos y hablen con toda fran- 
queza, digan todo lo que les ocurra.” 


El moderador tiene que informar a la gente que la sesión está siendo 
grabada/filmada, explicándoles que se necesita redactar un reporte de los resulta- 
dos de la reunión, y se hace muy difícil evaluar sus comentarios, hablar, escuchar 
y tomar notas a la vez. También el moderador debe explicar la ventanaw/espejo, y 
su funcionamiento. 
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Antes de iniciar la conversación, el moderador debe presentar algunas 
reglas para la sesión, como: 


+ Que solamente hable una persona a la vez. 

+ No hable con la persona a su lado. 

+ Levante la mano para expresar su opinión o hacer preguntas. 

+ Todos deben participar; sus opiniones son valiosas, 

+ No actúe con timidez, pensando que acaso lo que vaya a decir no sea 
bueno o valioso. Hable y exprese todo lo que se le ocurra. 

+ Hable en voz alta y clara, a fin de que se grabe con nitidez. 

+ Procure no salir de la sala ni levantarse hasta que termine la sesión. 

+ Utilice el primer nombre para llamar o referirse a mí o a cualquier otro 
participante. No use títulos, 


El moderador pedirá a los participantes que se presenten, para que se conoz- 
can entre sí. Los participantes deberán dar su nombre y una breve introducción 
de su familia y de su trabajo. 

La sesión se inicia con preguntas por parte del moderador, comenzando la 
plática y dejando que hablen los participantes. El moderador debe motivar a 
todos a que hablen. Hay que controlar a los que tienden a dominar al grupo, es 
decir, a quienes traten de acaparar la conversación; aunque siempre hay partici- 
pantes que hablan mucho y hay algunos otros que hablan muy poco. Muchas 
veces, sin embargo, de los que hablan menos surgen buenas ideas, pero por lo 
general, de aquellos que hablan más (son vocales) pueden salir muy buenas 
ideas. 

La discusión del grupo debe ser seria y formal, pero no aburrida, El mode- 
rador es responsable, a veces con bromas apropiadas, preguntas o explicaciones, 
de dar vida a la sesión y motivar a la gente a que participe y exprese su opinión. 
A veces el moderador debe hacer algunas bromas para que los participantes se 
sientan relajados y dejen de sentir que están en medio de un grupo de desconoci- 
dos. Debe lograr que los integrantes del grupo se sientan como si conocieran al 
moderador y a todos los demás participantes y que, por lo tanto, expresen su 
opinión de los temas a tratar de la forma más franca posible. 

Al concluir, el moderador puede salir de la sala e ir al cuarto de observación 
y preguntar a los observadores si hay algún punto más por cubrir. Debe además, 
quedarse unos minutos escuchando lo que platican, regresar y pedir a cada per- 
sona que dé algunas sugerencias y comentarios finales, y si no hay nada más qué 
cubrir, despedirlos y agradecerles. 


5.12 REDACCIÓN DEL REPORTE 


Cuando terminan las sesiones por el día, o en el período de tiempo después de 
cada grupo, el moderador se sienta con el cliente o con las personas de la sala 
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de observación para evaluar y analizar la información obtenida, comentar cómo 
estuvo el grupo y qué se aprendió, los puntos importantes que fueron logrados con 
el grupo, cómo puede mejorarse el grupo que viene, qué hay que agregar. Además, 
el moderador da su opinión a los observadores de lo que aprendió del grupo. 

Después de que terminan todos los grupos, el moderador debe revisar sus 
notas y las cintas grabadas para poder redactar el reporte para el cliente. Este 
reporte debe tomar en cuenta los objetivos del proyecto y contestar cada uno de 
ellos. El reporte viene con una introducción, explicando de qué se trata el 
reporte, cuándo fue realizado, nombre y dirección de la empresa, hora y fecha; 
metodología utilizada; es decir, screener, qué características tenían los partici- 
pantes, cómo fue el reclutamiento, cuáles fueron los objetivos del estudio, la 
guía de discusiones, cuáles fueron las preguntas que se presentaron, y, posterior- 
mente, el resultado en detalle, contestando todo lo que se esperaba de estos gru- 
pos. Incluir todos los otros puntos que se discutieron que no estaban previstos, 
así como sugerencias y opiniones finales de los participantes. Al final, una breve 
conclusión con la opinión del moderador acerca de la información obtenida, así 
como recomendaciones y sugerencias respecto de las acciones que deben 
tomarse en el futuro. 


5.13 BENEFICIOS USUALES DE LOS FOCUS GROUP 


Las sesiones de grupo tienen beneficios significativos en muchos casos de estu- 
dio, por ejemplo: 


5.13.1 Primera etapa de un estudio cuantitativo 


En algunos proyectos cuantitativos que deseen obtener información para deci- 
siones críticas, es crucial conducir algunas sesiones de grupo para entender 
correctamente el problema en estudio, así como encontrar todas sus variables. 
Simplemente el hecho de conocer cómo piensa la población bajo estudio acerca 
de sus variables, hace que las sesiones de grupo conducidas antes resuelvan el 
problema de tal manera que puedan lograr un ahorro de dinero, y, lo más impor- 
tante, agregar validez al estudio cuantitativo, ya que a través de sesiones de 
grupo, podemos reducir el número de variables, conocer las opiniones de la 
gente, asuntos que no estaban siendo considerados, y que ayudan al investigador 
a enriquecer su trabajo. Este tipo de proyectos donde se realizan sesiones de 
grupo antes de hacer el estudio cuantitativo, se llaman two phase studies (estu- 
dios en dos fases o dos etapas). 


5.13.2 Evaluación de las tácticas de publicidad 


Los focus group o sesiones de grupo muy frecuentemente se usan para evaluar 
tácticas, publicitarias, Imagínese cuán caro es filmar un comercial y qué desas- 
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troso sería que el mensaje publicitario no sólo no tuviera efectos positivos, sino 
que por añadidura dejara efectos negativos que deterioraran la imagen de la 
empresa, y bajaran las ventas del producto. Para evitar muchos problemas, por lo 
general el concepto publicitario, en una etapa muy preliminar, se trata en unas 
sesiones de grupo para evaluarlo y pedir a los participantes que opinen respecto 
al escenario, al texto, y que aporten sus propias ideas y sugerencias. También se 
puede evaluar si la gente capta fácilmente el objetivo del mensaje publicitario. 
Por lo general, en la evaluación de tácticas publicitarias, se traen a discusión va- 
rios conceptos para encontrar cuál prefiere el consumidor, A veces se traen los 
comerciales ya filmados o grabados antes de enviarlos al aire para que la gente 
evalúe y opine acerca de ellos, y, si hay errores o palabras que pudiesen ofender 
a la gente, suprimirlas y modificar el mensaje de acuerdo con las sugerencias de 
los participantes. 


5.13,3 Evaluación del estado de ánimo de los gerentes 


Es crucial a veces tener a los gerentes juntos en una sesión y dejarlos hablar. 
Esto ayuda a los ejecutivos de la empresa a entender el estado de ánimo, el senti- 
do de dirección de los gerentes, así como qué tan informados y qué tan contentos 
están con su trabajo. El moderador, que por lo general es una persona de fuera 
de la empresa, para lograr el objetivo de entender mejor a los gerentes, empezará 
la plática con problemas cotidianos, como dificultades con la competencia y/o 
asuntos similares pero externos a la empresa, para motivarlos a ofrecer opinio- 
nes; después dirige la conversación hacia a los objetivos de la sesión. Por ejem- 
plo, el moderador puede hablar acerca de la productividad en general, pero 
después pregunta qué sugerencias tienen para subir la productividad en su caso 
particular. También puede hablar acerca de la importancia de tener a la gente 
satisfecha y, luego de presentar una buena imagen, trasladar la sesión así a 
obtener sugerencias. Puede platicar de ventas y llevar sugerencias acerca de 
cómo motivar a los vendedores, a los representantes de la empresa, o simple- 
mente conversar acerca de la forma de tener una relación entendible y con 
armonía con el objetivo de incrementar la productividad y la eficiencia, y llevar 
la plática a que todos hablen de las dificultades que existen y las sugerencias 
para superarlas. Las sesiones de grupo gerencial son muy comunes y por lo 
general extraordinariamente beneficiosas. 


5,13,4 Ideas de nuevo producto 


Con frecuencia se utiliza una discusión de grupos para evaluar ideas, producir 
mensajes publicitarios, o simplemente para conocer los puntos de vista del con- 
sumidor con respecto a ciertos productos o servicios y como resultado de un 
focus group, surgen nuevas ideas. Por ejemplo, un participante sugiere ideas que 
facilitan el uso de un producto o servicio. Los empleados responsables de la 
compañía, que están sentados en la sala de observación usan esta idea e investi- 
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gando más, responden con un nuevo producto al mercado. Considerando este 
fenómeno podemos decir que las sesiones de grupo pueden ser una fuente extra- 
ordinaria de nuevas ideas respecto al producto. 


5.13.5 Evaluación del empaque 


El empaque de un producto está constantemente bajo supervisión del gobierno 
para proteger la salud ambiental y la salud del consumidor. Además, algunos 
empaques deben tener un diseño tal que sea fácil de abrir por un anciano o un 
niño. En otros casos el diseño deberá dificultar que los niños tengan acceso al 
contenido, como en el caso de medicamentos. En cualquier forma es el consumi- 
dor quien, en última instancia, deberá decir si el empaque es fácil de usar, fácil 
de almacenar y si es atractivo o no. Las sesiones del grupo ayudan extraordina- 
riamente a entender el punto de vista del consumidor al respecto, lo que permite 
a la firma modificar el empaque si es necesario para evitar problemas y mante- 
ner al consumidor satisfecho. 


5,13.6 Evaluación de la etiqueta 


Al mismo tiempo que se evalúa el empaque, también se puede conocer la 
opinión del consumidor respecto a la etiqueta. Podemos conocer qué porcentaje 
pone atención a la etiqueta leyéndola y haciendo caso al texto e indicaciones que 
allí aparecen, así como la opinión de ellos acerca de la información que dicen 
ver en la etiqueta y el porqué. También se puede evaluar el color y el diseño de 
la etiqueta, las letras empleadas en el diseño gráfico y casi cualquier otro asunto 
relacionado con ella, 


5.13,7 Evaluación del precio 


A través de sesiones de grupo se puede evaluar el precio de un producto o servi- 
cio. Podemos indagar acerca de los productos de la competencia y su precio. De 
esta manera se posee una herramienta para estudiar el precio que el consumidor 
está pagando por un producto/servicio similar, y analizar el precio al que se 
venderá el producto o servicio. 


5.13.8 Evaluación de la posición de la competencia 


En las sesiones de grupo la gente se expresa libremente acerca de todos los pro- 
ductos que usan, así como los productos que los sustituyen. A través de sesiones 
el moderador puede evaluar el grado de conocimiento de los participantes sobre 
diferentes marcas y la imagen que de cada marca tienen. También se pueden 
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evaluar las características del producto, establecer qué tan importantes son estas 
características y establecer si el consumidor está o no consciente de ellas. 

Podemos también averiguar qué características del producto o servicio de la 
competencia hacen que el consumidor lo prefiera. Por medio de las sesiones de 
grupo se pueden indagar y entender muchas cosas de la competencia que no se 
pueden conocer en una entrevista formal. 


5.13.9 Evaluación de la forma en que el consumidor 
usa el producto 


Es importante conocer la forma en que el consumidor usa el producto. A veces 
se pueden captar ideas que no se le habían ocurrido a los departamentos de mer- 
cadotecnia y de ingeniería-producción acerca de su uso. 

En una sesión de grupo, promover la discusión respecto a la forma de uti- 
lizar un producto y dejar que los participantes discutan y aprendan unos de otros, 
puede beneficiar mucho al fabricante. En ocasiones el productor necesita cono- 
cer estos aspectos para entender al consumidor y ofrecer un mejor servicio o 
simplemente comunicarse adecuadamente con el cliente. En un focus group los 
productores de arroz Uncle Beens querían ver cómo los mexicanos cocinaban 
este producto, así que en unas sesiones de grupo les pidieron que elaboraran el 
platillo mientras los representantes de Uncle Beens se quedaban a observar y 
aprender de ellos; en otra sesión de grupo se encontró que los mecánicos buscan 
herramientas menos caras, porque piensan que la gente se roba las herramientas 
de calidad. Lo importante aquí era conocer si una herramienta de menor calidad 
y más barata presenta la percepción de que puede servir igualmente, o si la fábri- 
ca puede hacer algo para prevenir el robo de herramientas. Éstas y otras infor- 
maciones es posible obtenerlas solamente en una sesión de grupo. 


5.13.10 Evaluación de razones por las cuales las ventas 
están bajando 


Cuando bajan las ventas de ciertos productos o servicios, las sesiones de grupo 
pueden ayudar a entender el porqué. Las sesiones de grupo entre consumidores 
revelarán el grado de satisfacción, razones de compra, la forma en que el pro- 
ducto se utiliza, la frecuencia de su uso, si ha bajado, por qué, productos 
disponibles de la competencia y productos que sustituyen al producto en 
cuestión, entre muchos otros aspectos que libremente se pueden descubrir, Si el 
resultado arroja que hay algo respecto al producto, servicio, o competencia, 
entonces los ejecutivos podrán tomar la decisión de mejorar el producto y corre- 
gir los problemas. Si no todo sale positivo durante la sesión con consumidores, 
entonces se pueden realizar grupos con vendedores y empleados que tienen con- 
tacto con los consumidores para descubrir los problemas y resolverlos. 
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5,14 EJEMPLOS: 


GUÍA DE DISCUSIONES DEL MODERADOR 
PRODUCTOS LÁCTEOS MEXICANOS 


Introducción 


Hola. Gracias por aceptar nuestra invitación. Mi nombrees__________,ysoy 
un consultor independiente. Estamos aquí para hablar acerca de productos 
lácteos. 

Primero que nada, quisiera destacar que yo no soy empleado mi productor, dis- 
tribuidor o vendedor de ningún producto lácteo, Soy un consultor independiente, Mi 
trabajo consiste en hablar con ustedes y tratar de averiguar qué les gusta y qué no 
acerca de estos productos; por lo tanto, por favor siéntanse libres de conversar y dis- 
cutir sus ideas abiertamente, No hay respuestas incorrectas, y todos sus comentarios 
serán apreciados. 

Quiero entender y evaluar las ideas de cada uno de ustedes. Sería muy difícil 
hablar, escucharlos a ustedes y tomar notas a la vez, por lo que estoy grabando esta 
sesión; es, por lo tanto, importante que hablen fuerte y claramente. Además, cuando 
yo esté escuchando esta sesión, a fin de no confundirme, apreciaría mucho que 
hablen uno a la vez. No hablen varias personas al mismo tiempo y, además, cuando 
alguno de ustedes esté diciendo algo, por favor escuchen a ver si pueden añadir algo 
0 hacer algún comentario. Si tienen algún comentario que hacer, por favor diríjanlo 
hacia mí, y no hacia la persona que tienen al lado. 


A. Autopresentación 


A fin de que nos conozcamos todos mejor, por favor diganme sus nombres, a qué se 
dedican y algo acerca de su familia. 


“Vamos a hablar acerca de diferentes productos lácteos: 
B. Piensen en helado: 


B.1 ¿Con qué frecuencia ustedes consumen helados? 
(Moderador: si alguien no come helados, sondear por qué.) 


B.2 ¿Qué marca de helado compran ustedes con mayor frecuencia? 
¿Por qué esta marca? 


B.3 ¿Qué sabor de helado compran ustedes con mayor frecuencia? 
BA ¿Qué sabor de helado les gustaría a ustedes, pero no lo hay en el mercado? 
B.5 ¿En qué ocasiones consumen ustedes helado? 


(Moderador: como golosina, en fiestas de cumpleaños, otras fiestas, acampan- 
do, como postre,) 
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B.6 ¿Qué cantidades compran ustedes cada vez? 
Sondear: empaque y tamaño del empaque. 


B.7 ¿Leen ustedes la información en el envase? 
¿Qué información debería tener el envase? 


B.3 ¿Les gusta el helado de dicta, o el helado de bajo contenido de grasa? 
Sondeo: ¿Alguna vez ha probado el helado de dieta? 
¿Cree que el helado de dieta sabe igual que el convencional? 

B.9 ¿Cuánto pagan ustedes por él? 

B.10 ¿Dónde compran ustedes helado? 

B.11 ¿Conocen ustedes alguna marca norteamericana de helado? 


B.12 ¿Han probado ustedes alguna vez alguna marca norteamericana de helado? 


B.13 ¿Cuál helado es más sabroso? 
¿El americano o la marca que ustedes siempre compran? 


B.14 Si ustedes encuentran marcas americanas de helado en el supermercado, 
¿comprarían el que siempre usan, o la marca americana? 


Ahora probemos algunos. 


El moderador pedirá al anfitrión que sirva cada sabor separadamente, y que los 
traiga. 
El moderador invita a cada participante a comer, 


B.15 Entonces, preguntar: 
¿Qué les parece? 
¿Les parece sabroso y delicioso? 
¿Prefieren éste o la marca que siempre compran? 
Sondear: ¿Por qué? ¿Por qué no? 


B.16 ¿Pagarían ustedes un poco más por este helado si estuviese disponible en esta 
ciudad? 
C. Yogurt 


C.1 ¿Con qué frecuencia consumen ustedes yogurt? 
(Moderador: si alguien no come yogurt, sondear por qué.) 


C.2 ¿Qué marca de yogurt compran ustedes con mayor frecuencia? 
¿Por qué esta marca? 
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¿Qué sabor de yogurt compran ustedes con mayor frecuencia? 


¿Qué sabor de yogurt les gustaría a ustedes, pero no lo hay en el mer- 
cado? 


¿En qué ocasiones consumen ustedes yogurt? 
(Moderador: como golosina, en fiestas de cumpleaños, otras fiestas, acampan- 
do, como postre.) 


¿Qué cantidades compran ustedes cada vez? 
Sondear: clase y tamaño del empaque 


¿Leen ustedes la información en el envase? 
¿Qué información debería tener el envase? 


¿Les gusta el yogurt de dieta, o el yogurt de bajo contenido de grasa? 
Sondeo: ¿Alguna vez ha probado el yogurt de dieta? 
¿Cree que el yogurt de dieta sabe igual que el convencional? 


¿Cuánto pagan ustedes por él? 


C.10 ¿Dónde compran ustedes yogurt? 


C.11 ¿Conocen ustedes alguna marca norteamericana de yogurt? 


C.12 ¿Han probado ustedes alguna vez alguna marca norteamericana de yogurt? 


C.13 ¿Cuál yogurt es más sabroso? 


¿El americano o la marca que ustedes siempre compran? 


C.14 Si ustedes encuentran marcas americanas de yogurt en el supermercado, ¿com- 


prarían el que siempre usan o la marca americana? 
Ahora probemos algunos. 
El moderador pedirá al anfitrión que sirva cada sabor separadamente, y que los 


traiga. 
El moderador invita a cada participante a comer. 


C.15 Entonces, preguntar: 


¿Qué les parece? 

¿Les parece sabroso y delicioso? 

¿Prefieren éste o la marca que siempre cómpran? 
Sondear: ¿Por qué? ¿Por qué no? 


C.16 ¿Pagarían ustedes un poco más por este yogurt si estuviese disponible en esta 


ciudad? 
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D. Leche 
Hablemos de la leche; 


D.1 ¿Con qué frecuencia consumen ustedes leche? 
(Moderador: Si alguien no toma leche, preguntar por qué.) 


D,2 ¿Cuál marca de leche compran ustedes con mayor frecuencia? 
¿Por qué esta marca? 


D.3 ¿En qué ocasiones toman ustedes leche? 
(Para aliviar la sed, en vez de agua, con el café, con la comida, con galletas, 
para cocinar arroz con leche, para hornear.) 


DA ¿Qué tipo de empaque compran ustedes usualmente? 
Sondear: tipo de empaque. 
Información acerca del empaque. 


D.5 ¿Dónde compran ustedes la leche regularmente? 
¿En el mercado o entrega a domicilio? 


D.6 ¿Están ustedes familiarizados con alguna marca americana de leche? 
—NOMBRE DE LA MARCA 


D.7 ¿Son las marcas de leche americanas diferentes de las marcas mexicanas? 
Sondear: ¿De qué manera? 


D.8 ¿Cuánto más pagaría usted por un galón de leche americana? 
Sondear. 


CIERRE 


Si estos productos se introdujeran: ¿cuál sería la mejor forma de informar al público 
de que la marca americana está a su disposición en super- 
mercados? 


SONDEAR: 
¿Publicidad (radio, TV, periódicos, bardas) 
Cupones promocionales. 


Degustaciones promocionales en puntos de venta. 


AGRADÉZCALES SU PARTICIPACIÓN, Y CIERRE LA SESIÓN. 
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MARKET STUDY INTERNATIONAL 
CUESTIONARIO DE SCREENING 
PRODUCTO LÁCTEO-Junio 1994 
(Versión en español) 


Buenos (días / tardes / noches). Mi nombre es y soy un(a) entre- 
vistador(a) de Market Study International. Estamos llamando a algunas per- 
sonas seleccionadas en esta área de la ciudad acerca de participar en un panel 
de discusión o sesión de grupo, en donde de diez a doce personas como usted 
serán invitadas a discutir sus ideas y opiniones sobre algunos importantes e 
interesantes temas. Si usted llega a calificar para este grupo, me gustaría invi- 
tarle a participar en él. Nosotros le pagaremos $30 por su tiempo y coopera- 
ción, Me gustaría hacerle algunas preguntas a ver si usted es el tipo de persona 
que estamos buscando: 


1. - [Entrevistador: sexo por observación]: [Entrevistador: Observar límite] 
Mujer( ) Hombre( ): 


2, ¿En cuál de las siguientes categorías se encuentra su edad? 
[Entrevistador: lea la lista, Acepte sólo una respuesta] 


Menos de 20 años () [Entrevistador: termine] 
20-30 años ()  [Entrevistador: continúe] 
31-40 años ()  [Entrevistador: continúe] 
41-50 años ()  [Entrevistador: continúe] 
51-55 años () [Entrevistador: continúe] 
Mayor de 55 años ( ) [Entrevistador: termine] 


3. Cuál de los siguientes describe mejor su estado civil: 
[Entrevistador: 70% de los participantes deberán ser casados. Vigile el 


límite] 

Casado () [Entrevistador: vigile] 
Soltero () [Entrevistador: termine] 
Separado o divorciado () [Entrevistador: vigile] 


4. — Cuántos niños de trece a catorce años viven en su hogar? 


Ninguno 9) [Entrevistador: termine] 
Uno a tres () [Entrevistador: termine] 
Cuatro o más 9) [Entrevistador: continúe] 


5. ¿Es usted de nacionalidad mexicana? 
Sí( ) [continúe] NO( ) [termine] 


6. ¿Es usted la mujer encargada del hogar? 
Sí( ) [continúe] NO( ) [termine] 
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7. Es usted responsable de la compra de abarrotes en su casa? 
Sí ( ) [continúe] NO( ) [termine] 
8. — Quétan frecuentemente compra usted las siguientes mercancías: 
No tan Casi 
Frecuente frecuente nunca 
Helados O O O 
Yogurt O €) O 
Leche 0) 109) O 
IMPORTANTE: Si el respondente contesta “casi nunca” a dos o más produc- 
tos, termine. 
9. ¿Ha participado usted en un panel de discusión o sesión de grupo en los últimos 


10. 


12 meses? 
SÍ( ) [termine] NO( ) [continúe] 


¿Trabaja usted o cualquier miembro de su familia en alguna de las siguientes 
áreas?: 


SÍ NO 
Agencia de publicidad O 19) 
Empresa de estudios 
de mercado O 0) 
Productores o 
distribuidores de 
productos lácteos () 0) 


NOTA: si en cualquiera de las anteriores (pregunta 10): 


Ll: 


SÍ( ) [termine] NO( ) [continúe] 


Cuál categoría describe mejor el salario mensual de la familia en el hogar: 
[En el primer grupo, los participantes tienen que pertenecer a las categorías A y 
B, en el segundo grupo C y D]. 


Salario por familia mensual 


1.1700más AyB [continúe] 
2.65a170 € [continúe] 
3.1065 D [continúe] 
4. Menosdel1 E [termine] 


12. Nos gustaría invitarlo a asistir a nuestro panel de discusión y apreciaríamos su 


asistencia. ¿Le gustaría participar? 
SÍ( ) [continúe] NO( ) [termine] 
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Muchas gracias por su colaboración. Esperamos verla(o) el día ¿ 
en la dirección: E 
Si tiene problemas para llegar, o no pudiese asistir, le agradecemos que nos llame al 
número: E 


[Entrevistador: Asegúrese de que los participantes saben llegar al lugar de la sesión. 
Dél+s el número de teléfono del sitio en caso de haber algún problema. 
Solicite nombre completo, dirección y teléfono] 


Nombre del entrevistado: Edad: 


Dirección: 


Teléfonos: Casa: Trabajo: 


CAPÍTULO 


6 


Fuentes de los datos primarios 


6.1 INTRODUCCIÓN 


En el capítulo anterior se habló de las fuentes de datos secundarios, sus ventajas, 
desventajas y tipos de datos secundarios. También se indicó que cualquier inves- 
tigación debe empezar con datos secundarios (como por ejemplo, revisión de li- 
teratura). Se pueden realizar muchos estudios utilizando sólo datos secundarios, 
pero no siempre es así, por lo que este capítulo se dedica a los datos primarios; 
el cómo y cuándo se necesitan generar éstos, sus ventajas y desventajas, y las 
posibles precauciones en el proceso de creación de este tipo de datos. En el capí- 
tulo siguiente se explica una de las principales formas de generar datos prima- 
rios (el cuestionario). 


6.2 DATOS PRIMARIOS 


Son aquellos que genera el investigador para encontrar soluciones a ciertos 
problemas; para tomar decisiones correctas en su labor. Tambien para hallar 
respuestas a preguntas que lo motivaron a desarrollar un proyecto de investi- 
gación. En ramas administrativas, tales como: planeación estratégica, mer- 
cadotecnia, recursos humanos y finanzas, los datos primarios son los que se uti- 
lizan con mayor frecuencia. Tienen la ventaja de que como son generados por el 
investigador, éste puede controlarlos y adaptarlos en la forma más adecuada y 
precisa para la toma de decisiones. Los datos primarios son más precisos, 
actuales, suficientes, disponibles y relevantes que los datos de fuentes secun- 
darias. Además, como esta información no existía anteriormente, representa un 
recurso confidencial de alto valor para la empresa investigadora, ya que nos 
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ara a cara 
Lo teléfono 

-Emrevistaz Por correo 

Sesiones de grupo 


Fuentes de datos 
primarios 


Con 
características 
mixtas 


Observaciones 


Figura 6.1 Clasificación de las fuentes de datos primarios. 


muestra un panorama de la vida real en el medio ambiente empresarial en el que 
se está desarrollando el estudio. 
Los datos primarios se pueden clasificar en tres grupos: 


1, Personales, 
2. Impersonales. 
3. Con característica mixta. 


Como se indica en la figura 6.1, los datos primarios personales se obtienen por 
medio de entrevistas y experimentos. La entrevista se puede llevar a cabo en 
forma directa (cara a cara), por vía telefónica, enviando el cuestionario por 
correo o por sesiones de grupo. 

Los datos primarios impersonales se obtienen por medio de la auditoría, 
indicios de alguien o algo, el análisis del contenido, y la simulación. 
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Los datos primarios con carácter mixto son aquellos que se pueden obtener 
por medio de observaciones tanto personales como impersonales. En la figura 
6.1 de la página anterior, se explica con detalles cada una de las fuentes. 

Las fuentes de datos primarios con carácter personal, por lo general 
requieren de un instrumento de medición estructurado, tal como los cuestiona- 
rios diseñados para realizar la entrevista directamente (cara a cara), telefónica- 
mente, o por medio del correo. Otra de las características de este tipo de toma de 
datos es el requerimiento de la participación directa del sujeto en estudio, 


6.3 ENTREVISTAS 


Se entiende por entrevista al proceso de interrogar o hacer preguntas a una per- 
sona con el fin de captar sus conocimientos y opiniones acerca de algo, con la 
finalidad de realizar alguna labor específica con la información captada. Hay 
diferentes formas de realizar esta tarea: por vía telefónica que es la más fre- 
cuente, por entrevistas personales, cara a casa, o por correo. 


6.3.1 Entrevista personal 


La entrevista personal se puede definir como una entrevista cara a cara, en 
donde el entrevistador pregunta al entrevistado y recibe de éste las respuestas 
pertinentes a las hipótesis de la investigación. Las preguntas y su secuencia 
demuestran el grado de estructuración de la entrevista. Las entrevistas perso- 
nales pueden llevarse a cabo en el domicilio de las personas (casa por casa), en 
su lugar de trabajo, mediante intercepciones en la calle o en centros comerciales, 
También al salir de un local de compras o al haber obtenido algún servicio (exit 
interview). 

El costo de la entrevista personal es relativamente alto y es mucho mayor 
que el de las entrevistas telefónicas o por medio del correo, debido a que en ella 
se requiere gran cantidad de personal entrevistador que tiene que trabajar en la 
calle con sol y con lluvia, y viajar para localizar los elementos poblacionales 
para entrevistas. 

Además el investigador tiene que seleccionar personas con buena pre- 
sentación, buena voz, habilidad para entrevistar, habilidad de aceptar el rechazo 
del público, dispuestas a trabajar en la calle y con habilidad de leer mapas para 
encontrar el sitio y los sujetos de estudio. No cualquier personal puede ser un 
entrevistador. Según la experiencia del autor, en algunos casos las mujeres son 
mejores entrevistadoras que los hombres.! El investigador debe dar adies- 
tramiento adecuado a los investigadores, para que éstos adquieran suficiente 


Y Los estudiantes de las carreras de Administración, Mercadotecnia y Contabilidad de la UNAM, 
pueden ser buenos administradores al recibir un buen entrenamiento, según la experiencia del autor. 
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habilidad para contestar las preguntas de los entrevistados, sean rápidos, pre- 
cisos, responsables y honrados en la recopilación de datos; que conozcan el 
objetivo general del estudio y la importancia de las entrevistas, etcétera. 

La entrevista personal tiene la ventaja de que el entrevistador puede dirigir 
el comportamiento del entrevistado, lo cual permite tener mejores entrevistas 
que con las otras dos formas de entrevista (correo y vía telefónica). Además ésta 
aumenta la posibilidad de participación de un mayor número de personas, o sea 
que el número de rechazos es menor en este tipo de entrevistas. 

Por lo general, en el proceso de entrevista personal intervienen tres per- 
sonas: investigador, entrevistador y entrevistado; o sea que el investigador 
encarga a alguien la realización de la entrevista, pero manteniendo el control y la 
supervisión del proceso de ésta. 

El investigador puede crear varias técnicas del control del desarrollo de la 
entrevista. Puede generar una sección al final del cuestionario, donde se anote 
dirección, teléfono y nombre del entrevistado. Estos datos sirven para que 
aleatoriamente se tome de un 5 a un 10% de los cuestionarios elaborados y se 
formule al entrevistado, por vía telefónica, algunas preguntas de verificación en 
una breve conversación como: “Soy fulano de tal, director del proyecto W de la 
empresa X, supervisor de Y, quien le hizo a usted una entrevista acerca de Z, 
Deseaba agradecerle por su participación en el estudio. Al señor Y se le olvidó 
preguntarle...”, 

En ese punto se deben repetir 2 o 3 preguntas de la encuesta para validar la 
respuesta, Este proceso se llama validación de entrevistas. Si el investigador 
encuentra cosas irregulares, tendrá que validar más entrevistas hasta llegar a una 
conclusión respecto a la validez del trabajo de campo. 

Otra técnica de control o de validación sería crear dos equipos de entrevista- 
dores, un equipo grande para realizar las entrevistas y otro equipo pequeño para 
verificar la elaboración de las entrevistas, de forma tal que cada día se selec- 
cione 5-10% de los cuestionarios elaborados para su verificación al día si- 
guiente, utilizando el mismo tipo de preguntas del ejemplo anterior.2 

También es muy importante cuidar cómo los entrevistadores seleccionan a 
los entrevistados, ya que esto también puede sesgar los datos de la entrevista. Se 
tiene la experiencia de que algunos entrevistadores pueden terminar rápidamente 
su trabajo al entrar en una escuela secundaria y en tres horas realizar 300 cues- 
tionarios o entrar en una oficina grande o una fábrica y terminar su trabajo rápi- 
damente. Para evitar estos casos, el investigador puede generar ciertas normas 
como: preguntar 50% - 50% entre hombres y mujeres, en cada calle preguntar en 
una de cada diez casas, en un centro comercial preguntar a una de cada veinte 
personas que pasen, entrevistar a gente mayor de 20 años de edad. No realizar 
más de una entrevista por casa, oficina pequeña o grupo, La clave está en no 


2 El autor aplicó las dos técnicas en sus investigaciones y los resultados obtenidos fueron satisfacto- 
rios. 
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entrevistar a más de una persona en un grupo pequeño, ya que las respuestas de 
una podrían influir sobre las de otras. 

Las técnicas estadísticas para seleccionar entrevistados han sido recomen- 
dadas por Kish?, Troldahl y Carter.* Éstas requieren más representatividad y 
consisten en hacer una lista de todos los posibles participantes por sexo, edad, 
dirección o nombre y seleccionar las entrevistas en forma aleatoria. 

Otros posibles sesgos que deben preocupar al investigador son la forma en 
que el entrevistador hace las preguntas y cómo registra las respuestas. Estas difi- 
cultades no se presentan cuando se tiene la precaución de escoger a los más ade- 
cuados en la selección de los entrevistadores y de proporcionarles un buen adies- 
tramiento. De cualquier manera vale la pena controlar hasta donde sea posible 
los sesgos mencionados. Se puede proporcionar una grabadora portátil a los 
entrevistadores y pedirles que graben algunas de las entrevistas, así como que 
marquen los cuestionarios correspondientes, y al final del día reunirse para que 
el investigador pueda escuchar las grabaciones, indicarles a los entrevistadores 
los errores cometidos y cómo evitarlos. 

Para que la comunicación entre el entrevistador y el entrevistado sea fácil, 
efectiva y con un mínimo de sesgo, los entrevistadores deben ser relativamente 
similares; es decir, con la misma manera de vestir, de hablar, de vivir y hasta la 
misma manera de pensar. No se puede entrevistar a grupos indígenas enviando 
entrevistadores con corbata y traje (bien vestidos) o mujeres con vestidos moder- 
nos, ni se puede entrevistar a los funcionarios de las empresas, con entrevista- 
dores mal vestidos. 


El valor de la entrevista personal 


La entrevista personal tiene grandes ventajas, así como algunas limitaciones en 
su aplicación. Una de las ventajas es la profundidad y el detalle de información 
que se puede obtener. Asimismo, el entrevistador puede añadir más datos para 
mejorar la calidad de la información. 

Otra ventaja es que el entrevistador tiene más control sobre el entrevistado 
respecto a otros métodos, además de que puede cambiar el lenguaje o aclarar las 
dudas que surjan para el entrevistado, 

Hay desventajas también en esta forma de entrevistas: 


1. El costo de este tipo de entrevistas es relativamente alto. 
2. Colaboración, cooperación de la gente: hay personas a quienes les 
desagrada revelar sus asuntos personales, o cualquier otra información, 


3 Kish Leslie, A. procedure for objetive respondent selection, Journal of American Estadistic 
Asociation, Sept. 1949, pp. 380-387. 

* Troldahl, Verling y Carter, Roy, E. Jr. "Random Selection of respondents with households”, 
Joumal of Marketing Research, mayo 1964, pp. 71-76. 
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con gente desconocida, por lo que se muestran reacias a colaborar con la 
entrevista. 
Requerimientos para una entrevista 


Hay ues criterios principales para el éxito de una entrevista: 


a) Accesibilidad a la información requerida por parte del respondente. 
b) Que los entrevistados entiendan su papel. 
c) Motivación que se necesita dar a los entrevistados. 


Técnica para entrevistar 


El procedimiento es difícil; todo lo que se dice o se hace en una entrevista puede 
afectar el estudio. A menudo los entrevistados reaccionan más según el grado de 
relación que se establezca, que por el contenido de la entrevista. 

Para incrementar la receptividad del respondente se debe establecer una 
relación amigable con el entrevistado y se debe considerar el estudio como 
valioso en su contenido. Usualmente es necesario que el entrevistador explique 
sus propósitos y los resultados esperados. 


+ La introducción. La primera reacción del entrevistado ante la entrevista es 
generalmente de cierta curiosidad y reservada cortesía. El entrevistador 
puede causar una buena impresión, presentándose a sí mismo, a su organi- 
zación y el ubjetivo de la entrevista. Una sonrisa, una actitud amable y una 
buena introducción dan muy buenos resultados. A menudo es bueno contar 
con cartas de identificación o de presentación. La introducción no debe ser 
muy detallada, ya que demasiada información puede producir sesgos. 

* La buena relación para la entrevista. El éxito en la entrevista tiene las 
mismas características que cualquier relación interpersonal. La situación 
de entrevista puede ser para muchos entrevistados, así que es conveniente 
dedicar tiempo en la explicación de lo que va a hacer. El entrevistador 
puede ayudar mucho recordando el hecho de que la entrevista es confiden- 
cial e importante y que las respuestas pueden ser libremente contestadas. 
La experiencia indica que esto ayuda a abrir la conversación. 

+ La entrevista. Una vez que se ha establecido un buen ambiente de comuni- 
cación, el trabajo se convierte en la técnica de recopilar la información, es 
decir, la entrevista se ajusta a su propio plan de preguntas donde el entre- 
vistador debe hacer las preguntas tal como están especificadas, con el fin 
de evitar malos entendidos. 


Una de las tareas más difíciles es hacer que las respuestas sean ade- 
cuadas para satisfacer los objetivos. Para ello, el entrevistador debe conocer 
concretamente los propósitos de cada pregunta. Otra valiosa técnica es ob- 
tener más información; esto es particularmente efectivo cuando la respuesta 
no es clara o consistente con algo que se ha dicho antes. 
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+ Grabando la entrevista. El método tradicional consistía en escribir las 
respuestas pero actualmente bay otros medios tales como la grabación, 
donde se requiere seguir algunas recomendaciones: 


a) Es importante grabar las respuestas en el lugar de la entrevista, 

b) En caso de presión de tiempo, es recomendable usar una grabadora de 
bolsillo para conservar lo esencial de las respuestas. 

c) Es conveniente repetir la respuesta, mientras graba, parafraseando o 
mientras escribe, según el caso. 


Uso de computadores portátiles (Notebook PCs) 


Con el avance de la tecnología de sistemas de información, hoy en día se pueden 
emplear computadores personales durante la entrevista personal; de esta manera, 
mientras se está realizando la entrevista, simultáneamente se están procesando 
los datos, Este sistema se conoce como C.A.P.I. (computer aided personal inter- 
view), que significa "entrevista personal asistida por computadora”. Esto da 
mayor formalidad a la entrevista, y otorga mayor eficiencia y seriedad al estu- 
dio. Sin embargo, cabe mencionar que en los países no industria-lizados no es 
seguro caminar por la calle con un computador en la mano, por lo que tal vez 
este tipo de entrevistas podría concentrarse en oficinas o entrevistando ejecu- 
tivos. 


Problemas en entrevistas personales 


En este tipo de entrevista, el investigador se enfrenta a dos tipos principales 
de problemas, los sesgos y el costo. Los sesgos a su vez, son por lo general de 
tres clases: error de muestra, error de no-respuesta y error de respuesta. 


* Error de no-respuesta. El error puede ocurrir cuando hay dificultades para 
encontrar al entrevistado que ha sido seleccionado por la muestra, especial- 
mente cuando se hizo probabilísticamente. Este error puede ser significati- 
vo cuando los no-entrevistados varían demasiado respecto a los entrevista- 
dos. 

* Error de respuesta. El sesgo aparece cuando los datos reportados difieren 
de los datos actuales. Una fuente de ese error puede estar en los procesos 
de tabulación y manejo de la información. Otra fuente está en el mismo 
entrevistado cuando no hay exactitud en su respuesta. Otra causa común 
de respuesta errónea está en el mismo entrevistador; esto suele suceder 
cuando se contrata personal eventual sólo para realizar las entrevistas. 


La entrevista personal puede ser estructurada; es decir, lleva un cues- 
tionario en el que las palabras y su secuencia son fijas. La razón de estructurar la 
entrevista es que si ocurre cualquier variación, ésta se considera del entrevistado. 
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La entrevista estructurada está basada en tres suposiciones: 


. Para cada objetivo del estudio, "el respondente tiene suficiente vocabu- 
lario común que hace posible la formulación de preguntas con frases con 
el mismo significado para cada uno de ellos".5 

2. Es posible hacer todas las preguntas con frases que signifiquen lo mismo 
para cada uno de los respondentes. 

. Como se supone que el significado de cada pregunta es idéntico para 
cada respondente, el contenido y la secuencia de las preguntas deben 
ser idénticas para todos los respondentes (por esto dicen que es 
estructurado). 


w 


La entrevista puede ser inestructurada. Esta forma de entrevista tiene cuatro 
característicasó: 


1. Se lleva a cabo con entrevistados que han tenido una experiencia particu- 
lar respecto al tema de estudio. 


2. Se refiere a situaciones analizadas previamente. 

3. Procede sobre la base de una guía de entrevista y especificación de temas 
relacionados con las hipótesis de la investigación. 

4, Está enfocada a las experiencias subjetivas consideradas en las situa- 
ciones en estudio.” 


6.3.2 Entrevistas por correo 


En este tipo de entrevista se envía el cuestionario al domicilio del sujeto en estu- 
dio y él (ella) después de contestar, la devuelve por correo al domicilio del 
investigador. 

Este tipo de entrevista es relativamente menos costoso comparado con los 
otros tipos de entrevista, pero tiene varias desventajas; la más importante de 
ellas es que muchas personas, al recibir el cuestionario, simplemente lo arrojan a 
la basura. Esto es más frecuente en los países desarrollados, en donde las ventas 
por correo son tan comunes que la gente, al considerar la entrevista como una 
forma de trampa o engaño, la desechan, con lo cual se ve afectada la investi- 
gación. Es por esto que en las entrevistas por correo el porcentaje de rechazo es 
alto. 


$ Richardson Sthepen, Dohrenwed Barbara, y Klein David, Interviewing; forms and functions 
(Nueva York: Basic Books, 1965, p. 40). 

$ Merton Robert y Kendal Patricia, The Focused Interview, American Journal of Sociology, No. 51- 
1946, pp.541-5577 

7 Para mayor información se puede consultar el Manual de Entrevista del Instituto de Investigación 
de Ciencias Sociales de la Universidad de Michigan, 1989, U.S.A. 
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En Jos países desarrollados es una forma de entrevistar muy común; en los 
países hispanos se le puede aplicar a los ejecutivos de empresas grandes y a los 
grupos de los estratos económicos medio-alto y alto.é Cabe mencionar que la 
razón principal por la cual no se han aplicado este tipo de entrevistas en los paí- 
ses en desarrollo es por el relativamente alto porcentaje de analfabetas. 

La entrevista por correo requiere de una identificación completa y correcta 
de los sujetos de estudio. Entonces, el paso inicial de la entrevista por correo es 
elaborar una lista de los domicilios de los sujetos de estudio. Ésta se puede 
obtener en los directorios de las cámaras comerciales e industriales, de directo- 
rios telefónicos, de la lista de los tarjetahabientes de crédito, de la lista de aho- 
rradores de cierto banco, de la lista de propietarios de vehículos, de la lista de 
clientes de ciertas revistas o periódicos, o simplemente, de las listas de clientes 
de ciertos negocios. 


Ventajas 


1. Menor costo. La entrevista por correo no requiere de entrevistadores 
capacitados, por lo cual es menos costosa comparada con las otras dos 
formas de entrevista. A veces se puede realizar en menor tiempo. El pro- 
ceso y análisis de este tipo de entrevista es más fácil. El costo de este tipo 
de entrevistas es más evidente cuando la población está geográficamente 
dispersa. 

2, Menor sesgo. Se pueden eliminar de la entrevista personal, sesgos tales 
como: selección de personas inadecuadas para las entrevistas, preguntas 
y registros inadecuados. 

3. Respuestas pensadas y consultadas. Permite contestar aquellas preguntas 
que requieren consultar documentos o personas. 


Desventajas 


1. Requiere de preguntas simples. Este método se puede usar para recopilar 
datos simples y cuando las preguntas sean sencillas y comprensibles con 
las instrucciones anexas. 

2. No hay oportunidad de aclarar las respuestas ambiguas. 

3. No hay control de quienes llenan el cuestionario. 

4. La tasa de entrevistados es relativamente baja. 

5. El tiempo en el cual se cumple el estudio es difícil de definir. 


*En los estudios de tipos generales de una industria, se han aplicado las entrevistas por correo, 
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Para evitar algunas desventajas de la entrevista por correo se han encontra- 
do varias formas de disminuir estas fallas? Las siguientes sugerencias influyen 
tanto en la rapidez de envío de los cuestionarios contestados como en la calidad 
de las respuestas. 


1. LA CARTA 


Es muy importante enviar a los participantes del estudio una carta anexa al cues- 
tionario. Esta carta debe tener una muy buena presentación, utilizando buen 
papel y cuidando que en la redacción se dé a conocer y se resalte la importancia 
de las respuestas de los participantes. La tipografía, el color, el tipo, el 
tamaño de la carta afecta el número de preguntas contestadas, dice el profesor 
Goode y su coautor, el profesor Halt.l0 A continuación se da un ejemplo de 
este tipo de carta: 


Estimada compatriota: 
Como usted sabe, el empleo del servidor público es la parte más importante de la 
estrategia federal, estatal y local para resolver problemas de ingreso y empleo 
para la gente desempleada, económicamente en desventaja. Es indudable que 
dicho programa se debe llevar a la práctica en todo el país. Probablemente usted 
también sabe que Jos programas de empleo del servicio público suscitan polémi- 
cas y que su futuro puede estar en peligro. Parte de la razón de que estos 
programas provoquen tanta polémica es por no haberse realizado evalua- 
ciones sistemáticas de los beneficios de éstos, tanto para los individuos 
empleados como para la comunidad servida. 

Debido a que esta evaluación específica tiene una significativa implicación 
Nacional, le pedimos dar a este cuestionario su pronta atención. Le agradezco su 
cooperación en esta evaluación. 


2. TIPO DE ENVÍO 


Hay que incluir en el envío un sobre con suficientes estampillas y la dirección a 
donde se debe devolver el cuestionario respondido. Es importante simplificar 
esta tarea lo más posible para la persona que participa en el estudio. 


3. INCENTIVOS 


Es muy común que junto con el cuestionario, o posteriormente, se envíe un rega- 
lo al respondente. Se acostumbra dar regalos tales como un llavero, o un boleto 


3 Burns, Alvin, "A Computer Simulation Approach to the Teaching of the Mail Survey Strategy 
Alternatives and Choise”, Decision Sciences, enero, 1978, pp. 15-68. 

10 Goode, William J. y Han, Paul K.. Metods in Social Research (Nueva York). McGraw-Hill, 1957, 
p. 179. 
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de cine o teatro. También se envía dinero, comúnmente en efectivo, en un monto 
que varía de acuerdo con el país y la complejidad del cuestionario. Á veces se 
¡nanda la mitad del dinero con el cuestionario, y la otra mitad luego de recibir 
las respuestas; las conocidas empresas Arbitran y Nilson, especializadas en 
medición de audiencia de estaciones de radio y T.V. en los Estados Unidos uti- 
lizan este procedimiento. 

) 


Estimado participante: 


Gracias por su participación en nuestro sondeo. Sus opiniones ayudarán 
a las tiendas de muebles a servir mejor a sus clientes. Anexo encontrará 
la segunda parte de este estudio, así como algunas calcomanías e 
instrucciones. Una ve2 completada esta fase, le enviaremos $5 por su 
colaboración, así como un certificado de regalo por $25 en su próxima 
compra de muebles. 

Apreciamos sinceramente su colaboración. Estamos llevando a 
cabo un gran proyecto a todo lo ancho del país, y esta es la segunda 
fase. Esta etapa es muy importante a fin de garantizar la validez 
de nuestro estudio. Sin su cooperación, no podríamos culminar este 
proyecto; por lo que queremos estar seguros de tener la direc- 
ción correcta. Nuestros entrevistadores lo llamarán para verificar su 
dirección y preguntarle acerca de sus respuestas a cada sección en el 
sondeo que se anexa. Ellos llamarán entre las 5 pm y las 9 pm de 
lunes a viemes, o los sábados entre las 10 am y las 8 pm. Si usted no va 
a poder atender nuestra llamada en ese horario, le agradecemos que por 
favor termine el sondeo y nos lo envíe por correo. 

Gracias de nuevo por su colaboración en este proyecto. 


Cordialmente, 


Director del proyecto 


Figura 6.2 Traducción al español de una carta que el autor está usando en un estudio 
nacional en los Estados Unidos durante la actualización de esta obra. 


4. SELECCIÓN DE LOS ENTREVISTADOS 


La selección de los entrevistados, básicamente depende de la naturaleza del estu- 
dio y de las características de la población en estudio. Sin embargo, más allá de 
la definición de la muestra no se puede hacer mucho en ei proceso de selección 
para incrementar la tasa de respuestas. Pero se debe reconocer qué característi- 
cas de los respondentes están asociadas con la tasa de respuestas y esto ayudará 
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al investigador a decidir si realiza o no la entrevista por correo. La tasa de 
respuestas es más alta en personas seleccionadas que en la población en general. 
Gente con mayor educación escolar, por lo general contesta y envía su respuesta 
con mayor frecuencia que la gente con poca educación escolar. Es más probable 
recibir respuestas de personas que están interesadas en el estudio y su resultado, 
que de aquellas que no tienen interés, Los ejecutivos, empresarios, y gente 
encargada de oficinas privadas o públicas responden más que los empleados 
promedio. Como corolario podemos resaltar que el éxito en este tipo de recopi- 
lación de datos depende directamente de la creatividad del investigador. 


5. INSISTENCIA 


La insistencia es una forma muy efectiva de aumentar la tasa de respuestas. 
Después de dos semanas de haber enviado el cuestionario se debe de enviar un 
recordatorio y después de cuatro semanas y seis semanas otro; es decir, enviar 
tres o más recordatorios. Es recomendable que con el último recordatorio se 
envíe un nuevo cuestionario con sus instrucciones correspondientes. 


6.3,3 Entrevista por teléfono 


Este medio es uno de los más usados en los países desarrollados; su popularidad 
radica principalmente en su aceptación y comodidad. 

A este método también se le conoce como encuesta por teléfono. En Estados 
Unidos algunos libros recomiendan no usar este método.!! La razón principal es 
que los autores piensan que existe una alta probabilidad de sesgo muestral en 
este tipo de entrevista, debido a que hay un alto porcentaje de la población que 
no tiene teléfono y que la muestra sólo representará a los que puedan pagar un 
teléfono. La razón de mencionar el comentario realizado por autores esta- 
dounidenses es llamar la atención respecto' a este fenómeno en los países his- 
panos. 

La opinión del Sr. Klecka, William y Tuch Farther, Alfred, en su artículo 
titulado “Random Digit Dialing: A Comparation with the Personal Interview" no 
es realista. La recopilación de datos vía telefónica es lo más práctico y común; 
es fácil controlar la tarea de recopilación de datos, monitorear la entrevista y su 
ca-lidad, y al mismo tiempo proporciona la tranquilidad de saber que el personal 
entrevistador no corre peligro en la calle recopilando datos, como es el caso con 
el método de entrevistas personales. 

En los Estados Unidos y demás países industrializados, donde los sistemas 
de comunicaciones son avanzados, la proporción de hogares con servicio tele- 
fónico es alrededor del 90% en general. Sin embargo, entre los diferentes grupos 
étnicos este porcentaje puede variar de 70 a 85%, Por ejemplo, para el sector 
demográfico de hispano parlantes latinos e hispanos que viven en los Estados 


UKlecka R, Williams, Tuch Fanther, Alfred, "Random Diget Dialing: A Comparation with (he inter- 
view personal”, Publicity Option Quaterly, 42, 1978.pp. 105-114. 


ENTREVISTAS 149 


Unidos, el porcentaje de personas que carecen de servicio telefónico es alto, no 
necesariamente por razones económicas sino culturales. Como un numeroso por- 
centaje de este grupo carecían del servicio telefónico en sus países de origen, no 
han desarrollado esta necesidad en Estados Unidos, por lo que no contratan el 
servicio. Esto es particularmente notorio en entre latinos recién llegados. 

Sin embargo, es correcto anotar que en países hispanoamericanos es con 
frecuencia imposible recopilar datos por teléfono que sean representativos de las 
características de la población, Este problema tenderá a desaparecer en el futuro 
cercano, en la medida en que avance la tecnología de las comunicaciones en his- 
panoamérica. Se puede usar esta técnica en un cierto segmento de la población, 
como los que tienen tarjetas de crédito o ciertos tipos de inversión bancaria. 


"Tally”. Registro de llamadas 


Es muy importante tener un registro de cada llamada. Este proceso se denomina 
"Tally". Al inicio del trabajo de campo de un proyecto (al iniciarse el proceso de 
llamadas telefónicas), cada entrevistador recibirá una planilla de control o "tally 
sheet", en la que registrará el resultado de cada llamada de acuerdo con el resul- 
tado obtenido. En la figura 6.3 se observa un ejemplo de un "Tally sheet". 


ombre del entrevistador 


SITUACIÓN: CANTIDAD 


Ocupado 


No contesta 


Máquina contestadora 


No residencial 


Rechazó censo 


Rechazado/calificado 


Llamar a otra hora 


Colgó en el medio 


Figura 6.3 Ejemplo de un "Tally Sheet" u hoja de registro de llamadas. 
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El registro de llamadas es crucial, ya que permite determinar el costo de 
cada entrevista, así como el costo total del estudio. Factores determinantes son la 
Tasa de Incidencia, y el tiempo de la entrevista: 


1. Tasa de Incidencia: se refiere al número de llamadas que es necesario 
hacer hasta encontrar una persona calificada para contestar la entrevista. 

2. Tiempo de la entrevista: es un parámetro cuya contabilización es impor- 
tante, ya que incide sobre el costo de la labor del entrevistador, así como 
el costo de la llamada, en caso de tratarse de larga distancia. 


En un futuro cercano se espera que este tipo de entrevista sea común y 
aceptable en los países hispanoamericanos, por lo que a continuación se describe 
brevemente el proceso, así como las ventajas y desventajas de la entrevista por 
teléfono. 

Básicamente, la técnica de entrevista por teléfono es similar a la de la entre- 
vista personal: muchas empresas aplican la misma técnica. Por lo general, cuan- 
do se intenta una entrevista por teléfono se pueden presentar seis diferentes 
situaciones; 

1. El número marcado está suspendido temporalmente. En esta situación se 

elimina el nombre de la persona de la lista. 

2. El número está ocupado; puede ser que el teléfono esté fuera de servicio, 

y entonces se eliminaría; o puede ser que alguien esté hablando en ese 
momento, en cuyo caso se insistiría 4 o 5 veces más y de continuar ocu- 
pado se eliminaría dicho número de la muestra. 

3. No contestan por no estar en casa, por lo que se insiste en hablar a dife- 

rentes horas. 

4, El número marcado está conectado a un Fax, o a una contestadora de telé- 

fonos. En este caso se elimina el nombre de la lista. 

5. El número llamado corresponde a un negocio. Igualmente se elimina de 

la lista. 

6. Si contestan el teléfono, existe la posibilidad de que la persona que nos 

interesa no esté en ese momento, o de que esté pero que no pueda contes- 
tar, en cuyo caso se insistirá. 


Un aspecto muy importante para lograr éxito en la entrevista por teléfono es 
la introducción de la conversación entre el entrevistador y el entrevistado. La 
introducción en este proceso tiene la misma importancia que la carta en la entre- 
vista por correo. 


Características de la entrevista por teléfono 
Las preguntas del cuestionario para la entrevista por teléfono no deben ser com- 


plicadas, deben ser preguntas cerradas, para evitar las conversaciones largas. Se 
deben eliminar las preguntas complicadas y largas. 
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Todas las preguntas, y de ser posible todas las respuestas deben ser breves, 
Las preguntas de la escala Likert!? son preferibles con tres categorías de 
respuesta. La conversación no debe durar más de diez minutos, y la razón princi- 
pal de ello es que el entrevistador no tiene control sobre el comportamiento del 
entrevistado, y si continua por más tiempo la conversación, es muy probable que 
se desvíen de los temas y se "cuelguen" en tiempo. 

Es muy importante que la voz del entrevistador sea agradable y que empiece 
con una presentación adecuada. 

Hay tres maneras de seleccionar a Jos participantes del estudio: el investi- 
gador puede usar una lista determinada con anticipación; un directorio, o un pro- 
ceso de números aleatorios para seleccionar a los participantes del estudio. 


+ La lista predeterminada. Puede ser una lista de personas con tarjeta de 
crédito, de ahorradores de un banco, de empleados de una empresa o de 
una fábrica, etcétera. 

+ El directorio. Se refiere a aquellos directorios especiales de empresas o 
tipos específicos de negocios. 

+ Números aleatorios. Es la selección en forma aleatoria de ciertos números 
sin preocuparse por ningún segmento de la población en particular. Se han 
preparado paquetes de microcomputador para seleccionar números tele- 
fónicos en forma aleatoria, Jlamar y hacer la entrevista. 


. Las grandes ventajas de este tipo de entrevista son: confiabilidad de sus 
datos, bajo costo y poder entrevistar a gentes importantes, que de otra forma no 
sería fácilmente posible, debido a que las secretarias de los ejecutivos filtran 
tanto las entrevistas por correo como las personales. 

La desventaja es que no se puede entrevistar a la población que no tiene este 
medio de comunicación; además, la entrevista es muy limitada, ya que no se per- 
miten mayores explicaciones. 


6.3.4 Entrenamiento a los entrevistadores 


Antes de iniciar el trabajo de campo de cada proyecto, se debe destinar al 
menos un día para el entrenamiento del personal que se hará cargo de las entre- 
vistas. Debe indicárseles cuál es el procedimiento de trabajo, cuál es el 
muestreo, el proceso selección de los candidatos a la entrevista, cómo deben pre- 
sentarse, y cómo pueden aumentar la tasa de colaboración. La parte fundamental 
de la entrevista consiste en conocer y manejar bien el cuestionario, saber regis- 
trar cada una de las respuestas que proporcione el entrevistado de manera 
apropiada, conocer perfectamente las indicaciones del cuestionario (skip pat- 
terns), que consiste en saber cuál es la pregunta que sigue luego de obtener cier- 
tas respuestas. Sin un buen conocimiento de la encuesta, se llevaría mas tiempo 


Wa el capítulo 9 se habla de la escala de Liken.. 
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en el momento de aplicarla. A este entrenamiento se le conoce en inglés como 
briefing, y es en esta sesión donde deben aclararse todas las dudas respecto del 
cuestionario. 


6.3.5 El trabajo de campo 


En el trabajo de campo, el supervisor debe indicarles a los entrevistadores cuál 
es la muestra que se va a utilizar en el estudio, y el supervisor debe revisar 
cuál es el trabajo que los entrevistadores hacen, con la finalidad de detectar 
posibles errores en el momento de la aplicación de la encuesta, pues de esta 
forma se puede saber si se requiere una explicación mas detallada, y poder 
reducir así el margen de errores. 

Durante los primeros 2 o 3 días, o cuando el supervisor lo considere nece- 
sario, debe reunirse con los entrevistadores para compartir las experiencias que 
han tenido durante la aplicación de la encuesta y de esta forma poder detectar los 
problemas con los que se enfrentan los encuestadores, y poder diseñar otra 
estrategia para que el estudio tenga éxito. 


6.3.6 Monitoreo 


En la recopilación de datos es primordial que se tenga control a fin de asegurarse 
de que los entrevistadores están aplicando correctamente la entrevista; es decir, 
que los entrevistadores estén haciendo las preguntas como están escritas en el 
cuestionario, y no de otra forma en la que el entrevistado no entienda la pregun- 
ta. El supervisor debe cerciorarse de que el entrevistador no trate de ayudar al 
entrevistado a obtener ciertas respuestas, así como que se esté aplicando la entre- 
vista a la persona adecuada. 

Para poder efectuar el monitoreo, se debe contar con un sistema telefónico 
(conmutador), en el que el supervisor pueda escuchar el desarrollo de la entre- 
vista sin que el entrevistador o el entrevistado lo puedan escuchar, así el supervi- 
sor desde otra línea sólo marca el código correspondiente al entrevistador al que 
desea monitorear. Existen sistemas mas sofisticados en los que una persona 
puede llamar a la empresa que está a cargo del estudio y su llamada se transfiere 
a una línea en la que el cliente puede escuchar el desarrollo de la entrevista con 
cada uno de los entrevistadores; de esta forma el cliente puede cerciorarse de 
que su estudio se está llevando a cabo en la forma en que fue diseñado. 

Por lo general las compañías que se encargan de este tipo de estudios cuen- 
tan con 20 o más estaciones, por lo que el supervisor debe estar monitoreando 
constantemente cada una de las estaciones y corregir las fallas que tenga el en- 
trevistador en el momento de aplicar la encuesta, o incluso para evitar que el 
entrevistador falsee la información; en este caso, deben desecharse del estudio 
las entrevistas que este entrevistador haya realizado, ya que hay incertidumbre 
respecto a la veracidad de esta información. 
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Las empresas que cuentan con sistemas de monitoreo reducen los costos de 
validación, puesto que al tiempo que se realiza el estudio, se realiza simultánea- 
mente la validación. Cuando el estudio se ha monitoreado, basta con validar de 
un 2 a un 3% de las entrevistas; sin el sistema de monitoreo, en cambio, se 
tienen que validar de un 15 a un 20% de las entrevistas realizadas; esto nos indi- 
ca que con un sistema de monitoreo, el índice de error disminuye. 


6.4 ENTREVISTAS ENFOCADAS AL GRUPO 


Es un tipo de entrevista personal relativamente desestructurada a un grupo 
pequeño, consistente de 8 a 12 participantes del estudio, a quienes se reúne 
para que comenten en detalle el asunto que interesa a la investigación, La per- 
sona que plantea las preguntas no es un entrevistador en el sentido tradicional 
de alguien que hace preguntas y anota respuestas. Más bien, tiene el papel de un 
conductor de la discusión o un moderador del grupo cuyo propósito es dirigir y 
enfocar la discusión del grupo hacia el asunto que se investiga. Muchas veces el 
entrevistador es realmente un participante directo en este tipo de discusión. El 
capítulo anterior se dedicó al estudio en detalle de las entrevistas o sesiones 
enfocadas a grupos, o focus groups. 

El ingrediente clave para una buena entrevista enfocada a grupos es el mo- 
derador, quien, al guiar cuidadosamente la discusión, evita el dominio de unos 
cuantos miembros del grupo y conserva la atención de éste orientada al asunto 
que interesa; puede hacer brotar de los participantes percepciones de las que ni 
siquiera ellos mismos estaban conscientes. 

Las técnicas comunes a emplear son tres: reacción en cadena, abogado del 


diablo y terminación en falso. 


Técnica de reacción en cadena 


El moderador construye un efecto acumulativo alentando a cada miembro del 
grupo a comentar un pensamiento o idea anterior expresada por otra persona del 
grupo, bien agregándole o extendiéndose sobre ella. 

Jugando al Abogado del Diablo, el moderador tiene que expresar puntos de 
vista extremos o polarizados, lo cual por lo general provoca reacciones en los 
miembros del grupo y mantiene la discusión en movimiento hacia los objetivos, 
de manera muy vívida. 

La terminación en falso ocurre cuando un moderador concluye falsamente 
una entrevista, agradece a los miembros del grupo su participación y les pregun- 
ta si tienen un comentario final por hacer. Con frecuencia, tales comentarios 
finales llevan a nuevas discusiones y dan por resultado la recopilación de datos 
muy útiles. 
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Las entrevistas enfocadas al grupo se pueden aplicar en las investigaciones 
de recursos humanos, de producción, de mercados; y además pueden propor- 
cionar información muy útil. Sin embargo, debido a que su naturaleza es poco 
estructurada, el reducido número de individuos que intervienen y sus caracterís- 
ticas, así como la relativa influencia del moderador sobre el grupo y las entrevis- 
tas enfocadas al grupo, no tienen mucha validez como fuente única de datos pri- 
marios. Hay que tener cuidado de no generalizar en demasía los resultados de la 
técnica. Además, hay que tomar precauciones adecuadas durante la entrevista, 
de modo que los resultados reflejen los pensamientos del grupo y no la idiosin- 
crasia del moderador o de uno de los miembros del grupo que haya sido domi- 
nante. Cuando se utiliza adecuadamente, la entrevista enfocada al grupo puede 
ser un dispositivo valioso para obtener datos en la investigación en el área de 
contaduría y administración, 


El control 


Las entrevistas personales tienen el poder de satisfacer la más alta calidad de 
datos, de los tres modos descritos para recopilarlos. Sin embargo, a veces las 
entrevistas personales pueden dar como resultado datos de la calidad más baja, 
aparente paradoja que se debe al fenómeno del control. Debido a que el entrevis- 
tador tiene alguna medida de control sobre el comportamiento de su entrevista 
do, se pueden obtener datos de muy alta calidad. Al mismo tiempo, puede ocu- 
rrir que el entrevistador no tenga mucho control sobre el comportamiento del 
entrevistado, En general, el investigador selecciona, entrena a los entrevista- 
dores, les da instrucciones para hacer las entrevistas, y los envía a recopilar 
datos, En este punto, el investigador efectivamente abandona el control sobre el 
proceso de las entrevistas, y esta relativa pérdida del control puede bajar la cali- 
dad de los datos, dependiendo de algunas de las características tanto del proyec- 
to como del entrevistador. 

La calidad de los datos puede resultar baja en las entrevistas personales 
cuando los entrevistadores, consciente o inconscientemente, inyectan errores y 
sesgo en el proceso de recolección. El entrevistador puede sesgar la recolección 
de datos y los resultados de la investigación, mediante: 


+ La manera en que seleccione a los participantes en el estudio. 

+ La manera en que plantee las preguntas; por ejemplo, variando la manera 
en que pregunta a los diversos participantes. 

+ La manera en que anote o registre las respuestas a sus preguntas; por 
ejemplo, no registrando una respuesta o no haciéndolo correcta o comple- 
tamente. 


Siempre hay algún grado de sesgo atribuible al entrevistador en las entrevis- 
tas personales, Por ejemplo, no escribiendo fielmente las respuestas. Incluso 
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cambiar el tono de voz al preguntar puede influir en la respuesta. Es responsabi- 
lidad del investigador reducir al mínimo tanto la fuente como la magnitud de los 
sesgos en la medida en que sea económicamente factible. 


6.5 EXPERIMENTO 


Como el experimento es la única manera de generar datos para los estudios 
causales, en el capítulo anterior se habló ampliamente del experimento y del di- 
seño experimental. 


6.6 DATOS PRIMARIOS IMPERSONALES 
6.6.1 Auditoría 


Es una manera de recopilar los datos primarios impersonales a través de por 
ejemplo, el examen y registro de los libros de contabilidad, de otros registros 
fiscales, o de hacer un análisis del inventario. 

Un ejemplo típico de auditoría es la revisión de las ventas. En auditoría de 
ventas se analizan datos de las ventas tales como el área geográfica y su fuerza 
de venta, a fin de investigar las relaciones entre estos factores y pronosticar las 
ventas. Otro ejemplo muy común es el de la visita de un mercadólogo o de sus 
colaboradores a una tienda para observar qué productos tienen y cómo se 
exhiben, número de estantes dedicados a este producto, su precio y la cantidad 
que existe en inventario. Una característica muy importare de este tipo de datos 
es que los recopila personalmente el investigador o sus ayudantes, y por lo ge- 
neral, están basados en el conteo de gente u objetos. 


6.6.2 Análisis de rastreo 


Es una manera de recopilar datos primarios impersonales que se dedica a estu- 
diar los antecedentes de alguien o algo (a rastrearlo). Se basa en datos históricos 
relativos al estudio, de los que no tienen conocimiento ni el investigador ni el 
sujeto de estudio. En las áreas de contaduría y administración se utiliza amplia- 
mente. En contaduría cuando se tiene la sospecha de un fraude o si existe alguna 
anomalía, se rastrea hasta encontrar su causa. En recursos humanos, para el 
estudio del comportamiento de alguien, se rastrea tanto su vida profesional 
como su vida personal. 

Este tipo de análisis también se utiliza en mercadotecnia y se le denomina 
estudio de basura. Para determinar entre los residentes de una comunidad lo que 
sus moradores comen, beben, leen (revistas y periódicos) y visten, se requiere 
que alguien busque en la basura, se registren los desechos y desperdicios y se 
determinen las frecuencias y las cantidades consumidas y utilizadas. 
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6.6.3 Análisis del contenido 


El análisis del contenido es otro tipo de datos primarios impersonales en el que 
se investiga el contenido de una cosa o de un objeto de estudio. Está muy rela- 
cionado con el análisis de rastreo. Un ejemplo típico de análisis de contenido es 
hacer un estudio del contenido de un mensaje publicitario o el de un paquete de 
información. 

En el análisis del contenido de un mensaje se evalúa su contenido, la causa 
0 razón de su lanzamiento y su efectividad. 


6.6.4 Simulación 


La simulación es un método con un gran potencial en el campo de la investi- 
gación de la administración para producir datos primarios. Una discusión en 
cualquier amplitud está fuera de los objetivos de esta obra. La discusión aquí 
está restringida a presentar la generalidad de la simulación y sus aplicaciones en 
el campo de contaduría y administración. A quienes deseen ampliar su 
conocimiento se recomienda consultar las referencias citadas.!3.14.15 


Definición 


La simulación se ha descrito y definido de varias maneras. Una definición muy 
común es: "Simulación es el proceso de crear esencia de la realidad sin que 
jamás en realidad se haya realizado". De manera general ha sido definida como 
"el proceso de realizar experimentos sobre un modelo de un sistema", Muchas 
simulaciones se han elaborado para entender la relación implícita en un sistema. 
Entonces, el uso de una simulación es útil cuando existen complejas interac- 
ciones entre muchas variables, especialmente, si algunas de las variables y/o sus 
relaciones no son lineales. 


6.6.5 Referencias de simulación 


La simulación ha tenido un fuerte impulso con el desarrollo de la compu- 
tación, La esencia de simulación es: 
a) Un modelo matemático del proceso o sistema en estudio. 
b) Una muestra de insumos.!é Estos insumos sintéticos pueden ser muestras 
de las informaciones actuales. Cuando se opera el sistema, se asegura una 
producción de resultados basados en la muestra de insumos. 


3 Gordon, Geofrey. System Simulation, Prentice -Hall, 1969. 

14 Phillips, Don, Ravindran, A. y Solberg, Janes. Principles and Practices of Operations Research, 
John Wiley 4: Sons, Inc., N.Y., 1976. 

15 Mize, Hie y Cor. Grady Essentials of Simulation, N-J. Prentice-Hatl, Inc., 1968. 

16 Emory, William y Niland, Powel, Marketing Management Decision, Boston Houghton Miftling, 
Co., 1968, p. 13. 
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Tipos de simulación 


Sin considerar la diversificación de la simulación en contaduría y adminis- 
tración, todos los modelos de simulación se pueden dividir en tres tipos: 


L SIMULACIÓN DESCRIPTIVA 


La simulación descriptiva requiere que el investigador identifique conceptos 
importantes para que de este modo aclare el problema. La simulación descriptiva 
ayuda al responsable de tomar la decisión a tener mejores alternativas porque: 


1, Transforma los datos en formas más expresivas. 

2. Indica el área de experimentación. 

3, Genera hipótesis por probar. 

4. Proporciona un cuadro de medición. 

5. Ayuda a pensar sistemáticamente respecto al problema en estudio y 

6. Presenta las bases necesarias para la discusión, por lo cual permite lograr 
un entendimiento común del problema, 


IL. SIMULACIÓN PREDICTIVA 


Es una forma de simulación que va más allá de la simulación descriptiva y 
predice el futuro. Exige al investigador no sólo identificar los conceptos impor- 
tantes, sino también las relaciones entre los conceptos y los conceptos predichos. 
Además de pronosticar, la simulación predictiva verifica la selección de los con- 
ceptos. La simulación predictiva permite que el investigador conozca cuáles 
conceptos afectan a los conceptos predichos más que otros,!” lo cual se conoce 
como análisis de sensibilidad. 


IL SIMULACIÓN PRESCRIPTIVA 


Es un tipo de simulación más específico acerca del futuro; indica al responsable 
de tomar decisiones qué acciones debe tomar. 

Tal vez quien toma la decisión no haga caso de la prescripción que le dé el 
modelo, pero éste le proporciona de cualquier manera, un valor exacto y a veces 
óptimo de la acción de la toma de decisiones. 

Para evaluar estos tres tipos existen seis criterios. !$ 


17 Zaltman, Gerald, "The structure and purpose of marketing models in behavioral model" 
Behavioral model of market analysis, Hinsdale, Ji, te Dryden Press, 1979, pp.29-31. 

15 Ehrenberg, Jean y Montgomery, David, “A Jramework for comparision of marketing models"; 
Journal of marketing research, Nov. 1977, pp. 439, 491. 


158 CIENCIA Y ADMINISTRACIÓN 


4) Respecto a la estructura. Quien toma la decisión posiblemente juzgará la 
estructura de un modelo de simulación de cinco áreas. 


+ Adaptabilidad. La facilidad de cambiar la simulación puede adaptar 
nuevas condiciones, 

* El grado de complejidad. Éste se refiere al alcance descriptivo de la simu- 
lación; la evaluación de todos los conceptos importantes y relevantes del 
problema de estudio. 

* El grado de facilidad para probar. Se refiere a que quien toma la decisión 
puede valorar la aplicabilidad de simulación del problema. 

* El grado de entendimiento. 

+ Fuerza o vigor. Es la habilidad de la simulación para producir resultados 
aceptables, 


b) El valor esperado. El investigador juzga el valor esperado de un modelo 
de simulación por los recursos que puede ahorrar y los beneficios que puede 
ofrecer el valor de adiestramiento del modelo para la toma de decisión, 

0) El costo inicial. Quien toma decisiones, tiene que evaluar los costos ini- 
ciales incurridos en diversas áreas. 

d) Las características de quienes toman la decisión. Se debe evaluar la uti- 
lidad del modelo de simulación con base en el costo de operación, la facilidad de 
comunicación, la facilidad de control, el volumen de insumo y el tiempo de res- 
puesta. 

€) El contexto del usuario. Se refiere a evaluar el medio ambiente del pro- 
blema en el cual se aplicará la simulación: el tipo de decisiones que se deben 
tomar, sus límites, su importancia y la frecuencia del uso del modelo de simu- 
lación, 

f) La historia de validación. Finalmente el responsable de tomar la decisión 
evaluará aspectos históricos de la simulación según sus conceptos, estructuras y 
referencias de uso exitoso. 


Condiciones favorables para la simulación 


Existen dos circunstancias esenciales: la primera, cuando se quiere realizar un 
experimento con problemas de administración pero se encuentra que no es 
factible realizarlo; la segunda, que cuando se construye un modelo para resolver 
un problema, se debe escoger entre un modelo analítico o uno de simulación. La 
simulación es como un procedimiento de prueba y error; es decir, no asegura al 
investigador que encontrará la solución óptima. 

Existen muchos problemas para los cuales no hay solución analítica o, al 
menos, no es posible alcanzarla a un costo razonable; en ocasiones el problema 
es muy complejo para la tecnología disponible. En estos casos, la simulación 
presenta ciertas ventajas. 
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Aplicaciones de la simulación en la administración 


a) Para determinar “tamaños de orden". 

b) En operaciones de producción. 

c) En rutinas de materiales en proceso. 

d) En sistemas de distribución complejos, etcétera. 


Una clase principal de aplicación son los problemas de espera o de "colas" y 
de "series de estación”, los cuales son comunes en la sociedad moderna. 

La simulación, como ha sido presentada, incorpora una aplicación de la téc- 
nica Monte Carlo, la cual se usa para incorporar variables aleatorias dentro de 
los modelos, es decir, sirve para escoger muestras de esas variables y usarlas en 
la simulación. 

No todas las simulaciones usan la técnica Monte Carlo, porque no todas 
incluyen variables aleatorias. 

Un caso muy conocido en la simulación de sistemas es la Dinámica de 
Sistemas. 


6.7 OBSERVACIÓN 


Es la forma directa de recopilar datos en el momento que ocurren ciertos even- 
tos. Como cualquier técnica de recopilación de datos, la observación tiene cier- 
tas ventajas y desventajas. 


6.7.1 Ventajas 


Hay muchas áreas de trabajo en las que la observación es un buen método, por 
ejemplo algunos grupos de niños que no pueden ser encuestados a través de un 
cuestionario; además, otros grupos humanos son difíciles de abordar por medio 
de encuestas. 

Otra ventaja de la observación es que se puede obtener información en el 
mismo momento en que está sucediendo y así no se depende de otras personas o 
publicaciones. Por otra parte, con este método se pueden estudiar ciertos hechos 
que de otra manera parecerían poco relevantes, como por ejemplo un estudio en 
tiendas de supermercado, donde lo importante es observar ciertos hechos, más 
que preguntarlos. Finalmente, otra ventaja es que hay menos rechazo para un 
observador en ciertos casos. 


6.7.2 Desventajas 


El mayor problema de este método es que el observador usualmente debe estar 
en la escena en el momento preciso, y no siempre es posible predecir cuándo van 
a ocurrir los eventos. La observación es un proceso lento y costoso que requiere 
equipo humano y técnico muy especializado. 
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Un tercer problema es la subjetividad de la capitación de la información con 
este método, en el cual dos observadores de un mismo evento, pueden percibirlo 
de diferente manera. 


El uso de la observación 


En este texto se usa el término "observación” en una forma mucho más amplia 
que sólo "mirar”; por ello, incluye un rango de monitoreo de condiciones y 
actividades que van desde las no conductivas hasta las conductivas. 


* Observación no conductiva. Una de las formas más representativas de este 
tipo de investigación es el análisis de grabaciones en cualquier medio, ya 
sea escrito o grabado. 

+ Observación conductiva, Puede clasificarse en cuatro tipos: 


a) Conducta no-verbal, incluye movimientos y expresiones. 

b) Conducta lingúística; es la segunda forma más usada del método de 
observación. 

c) Nivel extra lingúístico. 

d) Relación de "espacio” de la conducta. 


La relación de observador-sujeto 


Esta importante relación se puede considerar mediante tres perspectivas. 
Primera, si la investigación es directa o indirecta; segunda, si la presencia del 
entrevistador es conocida o no y tercera, el papel que el observador juzgue. 


+ Observación directa. El método directo describe la situación en la que el 
observador es físicamente presentado y personalmente maneja lo que 
sucede. Por su parte, la observación indirecta es el término usado para 
describir estudios en los que la grabación se realiza por otros medios 
técnicos. 

+ Ocultación del observador. La segunda decisión que afecta la relación es 
respecto a que se conozca la presencia del observador por parte del sujeto. 
Cuando es así, la conducta del sujeto puede distorsionarse e introducir ses- 
gos en el experimento. En algunas ocasiones es recomendable usar lentes 
o micrófonos a fin de no introducir riesgo de desviaciones. 

* Participación del observador. La tercera decisión es si el observador debe 
O no participar en el evento. Esta situación se presenta cuando el obser- 
vador es, al mismo tiempo, un participante en la “observación” de investi- 
gación. Estos rasos sen, en ciencias sociales, los menos comunes. 
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Diseño de la observación 


» La decisión de observar. La observación se consigue en casi todos los 
estudios de investigación, al menos en su etapa de exploración. En general, 
esta decisión debe tomarse cuando el investigador avanza desde “pregunta 
de investigación”, hacia el planteamiento del proceso de investigación. 

* Especificación del contenido. Cuando la especificación de los sucesos su- 
giere un estudio observacional, nos trasladamos hacia un contenido de 
observación. Cuando está incorporado, este contenido especifica un buen 
sistema de reporte y una buena correspondencia con las preguntas de 
medición antes tratadas. La especificación del contenido debería incluir 
tanto las principales variables de interés como otras que puedan afectar el 
estudio. 

+ El observador. A la selección y entrenamiento de observadores usual- 
mente se le da poca atención, El observador debe tener suficiente concen- 
tración en el momento del suceso: además, debe tener habilidad para recor- 
darlo en la grabación. Se debe informar a cada observador acerca de los 
sucesos específicos y el contenido preciso del tema que se estudiará; 
además de que se le debe dar amplia oportunidad de preguntar en las 
sesiones de entrenamiento. 


CAPÍTULO 


7 


Elaboración del cuestionario 


7.1 INTRODUCCIÓN 


Ya se habló respecto a las diferentes formas de recopilar datos y las fuentes de 
los datos primarios y secundarios. También se mencionó que para recopilar 
datos primarios por medio de entrevistas formales se debe usar un cuestionario, 

El cuestionario es la traducción de los objetivos de la investigación a pre- 
guntas específicas. Por tanto, se puede decir que la fundación de todos los cues- 
tionarios son las preguntas; contestar las preguntas del cuestionario proporciona 
datos para probar las hipótesis. Las preguntas deben motivar a los entrevistados 
a que proporcionen los datos necesarios. En este caso se estudia cómo elaborar 
un cuestionario confiable cuyas preguntas no tengan sesgo. 


7.2 DISEÑO DEL CUESTIONARIO 


El diseño del cuestionario es un arte, no una ciencia. En los últimos años ha pro- 
gresado bastante. Mucho del progreso ha sido en forma de advertencias tales 
como “evitar preguntas que sugieran o insinúen la respuesta”, “evitar preguntas 
ambiguas” . La figura 7.1 ofrece un método que el participante puede usar para 
elaborar cuestionarios. 

Los investigadores más experimentados desarrollan sus propios modelos, 
aunque los pasos que se listan en la figura 7.1 serán parte de este diseño. 

Los investigadores rara vez logran elaborar un cuestionario siguiendo 
paso por paso el modelo de la figura 7.1. Un desarrollo más atípico requerirá 
repeticiones e intercalaciones. El investigador encuentra que el contenido no 
está completamente acorde con la información deseada. Este descubrimiento, 
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1? Especificar la información 
requerida 


2” Determinar tipo de preguntas y forma 
de recopilar la información 


3” Determinar el contenido 
de cada pregunta 


4? Determinar la forma de respuesta 


de cada pregunta 


5? ¿Qué palabras debe utilizar en cada 
pregunta? 


6” Determinar la secuencia de 
las preguntas 


7? Evaluar y probar el cuestionario 


Figura 7.1 Proceso de elaboración de un cuestionario. 


por supuesto, requerirá que regrese a otro paso para efectuar los cambios nece- 
sarios. 

También se debe advertir a los investigadores no realizar los pasos literal- 
mente. Sólo se presentan como una guía. Los cuestionarios únicamente permiten 
saber si se obtienen los datos necesarios hasta aprobarlos. 


7.3 INFORMACIÓN REQUERIDA 


Hasta cierto punto es fácil decidir cuál es la información que se busca si los 
investigadores han sido meticulosos y precisos en las primeras etapas del proce- 
so de investigación. Si los investigadores han sido desordenados y no han tenido 
cuidado, la decisión será difícil. 
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La investigación descriptiva y la causal requieren de suficiente conocimien- 
to para poder elaborar las hipótesis específicas para la investigación, las cuales, 
a su vez, guían la investigación. Las hipótesis también son una guía para el cues- 
tionario. Determinan qué información se buscará y de quién, y especifican qué 
relaciones se investigarán. 

Si los investigadores han observado la advertencia de establecer tablas 
“dummy” para el análisis de datos, su trabajo para determinar qué información 
se va a obtener está esencialmente completo. Los investigadores deben recabar 
información de las variables especificadas en las tablas “dummy” para investigar 
estas hipótesis, Además los investigadores deben obtener esta información de las 
personas indicadas. 

Las hipótesis no son sólo una guía para saber qué información se buscará, 
sino en gran parte también determinan qué tipo de pregunta y qué forma de 
respuesta se usará para obtenerla, 

Es posible que durante la preparación del cuestionario surjan otras hipótesis 
y otras relaciones que pueden ser investigadas con un poco más de esfuerzo y 
costo, Una advertencia muy importante: si la nueva hipótesis es vital para enten- 
der el fenómeno, inclúyala y úsela cuando elabore el cuestionario. En cambio, si 
sólo es interesante y no vital, olvídela. La inclusión de preguntas interesantes y 
no vitales sólo alargan el cuestionario, y causan problemas en la administración 
y el análisis. 

El cuestionario para un estudio exploratorio está estructurado de manera 
diferente. Como la idea de estudio exploratorio es descubrir ideas y pensamien- 
tos, las preguntas están estructuradas en forma inconsistente. Al elaborar un 
cuestionario para el estudio exploratorio, lo más conveniente sería hacer una 
lista de toda la información y conocimientos necesarios. 


7.4 DETERMINAR EL TIPO DE PREGUNTAS 
Y LA MANERA DE OBTENER LA INFORMACIÓN 


Después de especificar la información básica que se buscará, el investigador 
necesita especificar cómo la obtendrá. El “cómo” requiere decisiones con 
respecto a la estructura que se usará en el cuestionario y si se enviará por correo, 
teléfono o entrevistas personales. Si el investigador decide utilizar un cues- 
tionario disfrazado, sin estructura, usando una fotografía como estímulo, esto 
evita entrevistar por teléfono y hace surgir preguntas serias acerca de una entre- 
vista por correo. De igual manera, dicha entrevista es recomendable para 
cuestionarios sin estructura y no disfrazados con preguntas abiertas, particular 
mente si éstas deben tener pruebas. 

Por supuesto, el tipo de información que se debe recopilar tendrá un impor- 
tante efecto sobre estas preguntas, por lo que el investigador puede estar 
interesado en hechos, opiniones, actitudes, motivación de los entrevistados o su 
grado de conocimientos acerca de ciertos temas. En general, las preguntas se 
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pueden clasificar en dos categorías: preguntas basadas en hechos, y preguntas de 
Opinión. 


7.4,1 Preguntas basadas en hechos 


Las preguntas basadas en hechos están diseñadas para obtener información obje- 
tiva de los entrevistados (sujetos del estudio) respecto a sus antecedentes, su 
medio ambiente, sus hábitos y sus gustos. Las preguntas basadas en hechos más 
comunes son de antecedentes, que se preguntan principalmente para obtener 
información que puede servir para clasificar a los entrevistados, como: género, 
edad, estado civil, ocupación, nive: educativo o ingreso. Estas clasificaciones 
ayudan a determinar la diferencia en comportamiento o actitudes. 


Ejemplo: 


¿Cuál es su estado civil? 
1, Casado(a) 4. Divorciado(a) 
2, Soltero(a) 5. Viudo(a). 
3. Unión libre 


Otro tipo de preguntas basadas en hechos pueden ser preguntas que propor- 
cionan información respecto al medio social del entrevistado. 


Ejemplo: 
¿Con qué frecuencia va usted al cine? 
1. Una vez a la semana 4, De vez en cuando 
2. Quincenalmente 5. Otro; especifique 
3. Una vez al mes 
Para este tipo de preguntas se puede usar la técnica de entrevistas por telé- 
fono, por correo o personales. Los métodos no son igualmente atractivos de 
acuerdo con el costo y con otras consideraciones, pero todos pueden usarse. 
7.4.2 Preguntas de opinión 
El concepto de “actitud” se refiere a la suma total de inclinaciones, perjuicios, 


ideas, temores y convicciones acerca de cualquier tema específico.? Las opinio- 
nes son, además, expresiones verbales de las actitudes. Una declaración como: 


1 Thurstone, L., The Atritude can be measured, American Journal of Sociology, enero, 1928, p. 529. 
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“La Organización de las Naciones Unidas debe luchar contra la guerra, la mise- 
ria y el hambre, así como contra la influencia que los países industrializados 
ejercen sobre los países del tercer mundo” refleja una opinión contra los países 
industrializados; pero una actitud acerca de la influencia que estos países ejercen 
sobre los países pobres será una orientación más amplia de lo que la gente siente 
y piensa acerca de la política del primer mundo. 

Una actitud puede orientar hacia ciertas tendencias, tomando algunas 
acciones o reacciones en cierta forma cuando se enfrenta a ciertos estímulos, 

En cambio, un investigador interesado en medir actitudes no podrá usar 
todos los métodos; decidir cuál usará, depende de previas decisiones con respec- 
to a la estructura y si es disfrazado o no. Una decisión de usar una escala muy 
grande de actitudes por ejemplo, evitará un tipo de entrevistas por teléfono, 
aunque podría ser por correo o personal. En cambio, un cuestionario con pregun- 
tas abiertas y cerradas sobre actitudes, crearía problemas si se proporciona por 
correo. El investigador debe especificar precisamente qué datos básicos son 
necesarios, cómo se van a recopilar, qué tipo de estructura y qué grado de dis- 
frazamiento se usará y cómo se va a aplicar el cuestionario. 


7.5 CONTENIDO DE UNA PREGUNTA INDIVIDUAL 


Las decisiones previas del investigador con respecto a la información necesita- 
da, la estructura, el disfrazamiento y el método para aplicar el cuestionario, 
controlarán en gran parte las decisiones con respecto al contenido de una pre- 
gunta individual, pero el investigador puede y debe formular algunas preguntas 
individuales, como: 


7.5.1 ¿Es necesaria la pregunta? 


Suponga que es importante. Entonces el investigador necesita preguntar si el 
punto ha sido adecuadamente cubierto por otras preguntas. Si no, debe hacer una 
nueva pregunta, La pregunta deberá ser estructurada para asegurar una respuesta 
con el detalle requerido, pero no una respuesta con más detalles de los necesa- 
rios. 

Estos análisis deben realizarse con tres preguntas típicas: 


+ ¿Entenderá el entrevistado la pregunta? 
+ ¿Podrá el entrevistado contestar la pregunta? 
+ ¿Contestará el entrevistado la pregunta? 


Responder a la primera pregunta es una evaluación del grado de ambigiie- 
dad, es decir, que la pregunta es ambigua o sus palabras lo son, o bien que la 
pregunta está en términos técnicos para el entrevistado. Todas estas interrogan- 
tes se pueden contestar si el investigador tiene conocimientos adecuados 
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respecto a los individuos que serán entrevistados. Si la pregunta está dirigida 
hacia la población en general, entonces debe ser sencilla e inteligible; en gene- 
ral, si está orientada a los ejecutivos, la pregunta podrá tener un nivel elevado. 


7.5.2 ¿Son necesarias varias preguntas en vez de una? 


Con frecuencia habrá situaciones en las que varias preguntas serán necesarias en 
vez de una, Considere la pregunta “¿Por qué usa la crema dental X?” 

Alguien responderá “para reducir las caries”, mientras otro responderá 
“porque me la recomendó el dentista”. Obviamente dos diferentes cuadros de 
referencia están siendo empleados para responder esta pregunta. La primera 
respuesta está respondiendo en términos de por qué una persona está usándola 
ahora, mientras que la segunda persona responde en términos de cómo empezó a 
usarla, Sería mejor desglosar esta pregunta en varias preguntas separadas que 
reflejen los posibles marcos de referencia que se podrían usar; por ejemplo: 


+ ¿Cómo empezó usted a usar la crema dental X? 
+ ¿Cuál es su principal razón para usarla? 


7.5,3 ¿Tienen los entrevistados la información necesaria? 


El entrevistador deberá examinar cuidadosamente cada pregunta para investigar 
o descubrir si el típico entrevistado tiene la información que busca. Los entrevis- 
tados darán respuestas, pero si éstas significan algo o no, es otro asunto. 

Para que las respuestas tengan significado, las preguntas necesitan significar 
algo para el entrevistado. Es decir, primero, el entrevistado necesita ser informa- 
do con respecto al problema inherente a la pregunta, y segundo, el entrevistado 
debe recordar la información. 

Considere la pregunta: “En general, ¿cuánto gasta su familia en abarrotes a 
la semana?” A menos que el entrevistado no haga las compras de abarrotes o la 
familia no opere con un presupuesto fijo, es muy probable que él o ella lo sepan. 
En una situación como ésta, es muy útil usar preguntas filtro antes de usar esta 
pregunta para determinar si la persona tiene esta información. Un ejemplo de 
pregunta filtro puede ser: “¿Quién hace las compras de abarrotes en su familia?” 

La persona no sólo debería tener la información que se busca, sino que él o 
ella deben recordarla. Nuestra habilidad de recordar varios eventos está influen- 
ciada por el hecho en sí y su importancia, el tiempo que ha pasado desde el 
suceso y la presencia o ausencia de estímulo que permitan recordarlo. Los suce- 
sos importantes son más fáciles de recordar que los sucesos sin importancia. 
Necesitamos ponernos en el lugar del entrevistado, no en el del gerente de la 
empresa, cuando se decide si la información es suficientemente importante 
como para que la persona la recuerde. 

También se necesita reconocer que la habilidad del individuo de recordar 
un evento está influenciada por cuánto tiempo hace que sucedió. Si el evento 
puede ser considerado relativamente sin importancia para la mayoría de los 
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individuos, se debería preguntar acerca de los acontecimientos recientes de tipo 
personal. 

El tercer factor que afecta nuestra habilidad para recordar es el estímulo que 
nos den. Existe un incremento definitivo en la retención cuando la memoria del 
entrevistado está estimulada con una medida para recordar. Además, una medida 
para recordar asistida, produce mayores recuerdos que una medida de recuerdo 
no asistida. 


7.54 ¿Darán los entrevistados la información? 


Algunas veces los entrevistados tendrán la información pero no la darán. Su 
voluntad parece estar en función de la cantidad de trabajo que necesita para pro- 
ducir una respuesta, su habilidad para articular una respuesta y la sensitividad de 
la información que se le pide mediante la pregunta. 

Quienes elaboran un cuestionario deben estar totalmente conscientes de la 
cantidad de esfuerzo que necesitan realizar los entrevistados para dar la informa- 
ción que se busca. Cuando el esfuerzo es excesivo, ellos darán respuestas 
aproximadas, o las omitirán completamente; por lo tanto, estos tipos de pregun- 
tas tienden a irritar a los entrevistados y a alterar su cooperación con el resto de 
la medición. 

Cuando los entrevistados no pueden enunciar sus respuestas porque las igno- 
ran, también se rehúsan a cooperar con otras partes de la medición. Tales 
preguntas se deben evitar, a menos que el investigador utilice una buena parte de 
energía creativa para encontrar un mecanismo que permita al entrevistado enunciar 
sus puntos de vista. Por ejemplo, si ellos no son capaces de expresar sus preferen- 
cias, acerca de un modelo de auto, el investigador debería poder mostrar fotografías 
de diferentes modelos para que el entrevistado escoja el que más le guste. 

Cuando la pregunta es peligrosa o amenaza al entrevistado, éste se rehusará 
a cooperar. Tales preguntas se deben evitar lo más posible. Si esto es imposible 
porque la pregunta es muy importante para el estudio, entonces el investigador 
debe poner mayor atención en cómo formular esta pregunta, particularmente 
respecto a los puntos de localización y redacción. Por ejemplo, el nivel de ingre- 
so es un tema muy delicado. La respuesta del entrevistado depende de cómo y 
cuándo el investigador haga esta pregunta. 

En general, es mejor colocar este tipo de preguntas al final en vez de al prin- 
cipio. 

Cuando se debe preguntar sobre temas delicados se deben considerar algu- 
nas formas de hacerlas menos molestas. A continuación se enuncian algunas: 


1. Esconder la pregunta en un grupo de otras menos delicadas. 

2. Establecer que el comportamiento o actitud es común antes de realizar las 
preguntas específicas al entrevistado. 

3. Parafraseando la pregunta en términos de otras personas y cómo se sen- 
tirían o actuarían. Ejemplo: ¿Cree usted que la mayoría de la gente 
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miente al hacer su declaración de impuestos? ¿Por qué? Aunque los 
entrevistados pueden revelar sus propias actitudes hacia evadir 
impuestos cuando preparan su declaración de impuestos al formular 
estas preguntas, sería muy difícil que lo hicieran si se les pregunta direc- 
tamente y el porqué, 

4, Estableciendo la respuesta en términos de un número de categorías que el 
entrevistado simplemente puede comprobar, en lugar de preguntarles a 
las mujeres su edad por ejemplo, uno puede simplemente darles una tarje- 
ta con la categorías de edades: 


y pedirles que respondan adecuadamente según la letra que les corres- 
ponda. 

5, Utilizando el modelo de respuesta al azar. El modelo de la respuesta al 
azar, por ejemplo: pedir al entrevistado que saque pelotas de colores de 
una urna, Se pidió al entrevistado contestar la pregunta A si, por ejemplo, 
la pelota es azul y la pregunta B, si es roja, El entrevistador no conoce la 
pregunta que está respondiendo el entrevistado, porque nunca ve el color 
de la pelota. En estas condiciones hay menos posibilidades que el entre- 
vistado no conteste la pregunta o distorsione la respuesta. Un estudio para 
investigar la incidencia de robos en las tiendas podría emparejar la pre- 
gunta sensitiva: ¿Alguna vez ha robado usted algo en una tienda?, con la 
inocente pregunta: ¿Es su cumpleaños en enero? La incidencia de robos 
en la tienda puede todavía estimarse usando un modelo estadístico ade- 
cuado o debido a que el porcentaje de entrevistados que contestan cada 
pregunta es controlado por la proporción de pelotas rojas y azules y la 
probabilidad de que el entrevistado responda a la pregunta A es de la 
mitad; además, la proporción de personas cuyos cumpleaños sean en 
enero es de 0.05 de acuerdo con un censo. Suponga que la proporción 
que contestó “sí” a cualquier pregunta A o B es de 0.20, utilizando las 
leyes estándar de probabilidad, se podríá estimar que la proporción de 
las personas que respondieron “sí” a la pregunta delicada, usando la 
siguiente fórmula?3 


2 Reinmuth, James y Geurts, Michael, The collection of sensitive information using a two stage ran- 
domized Madel, Joumal of Marketing research, noviembre, 1975, pp. 402-407. 

3 Campell, Cauy y Joiner, Brain. How to ger answer without being sore y0u have been asked the 
question, The American Statistic, diciembre, 1973, pp. 229-231. 
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A=PXLst (1 — P). La 
donde: 


A = Ea proporción total de respuestas “sí” en ambas preguntas. 
P = La probabilidad de que la pregunta delicada sea seleccionada. 
1 — P = La probabilidad de que la pregunta inofensiva sea seleccionada. 
Es = La proporción de respuestas “sí” a la pregunta delicada. 
La = La proporción de respuestas “sí” a la pregunta inofensiva. 


Sustituyendo las cantidades apropiadas, se tiene que: 


20 = $0 Ls + .50 (05) 
Ls = 35: 


o que 35% de los entrevistados ha robado en una tienda. Nótese que el 
investigador no puede usar la técnica de respuesta al azar para determinar 
específicamente quiénes han robado en una tienda, o, por ejemplo, para 
determinar si el comportamiento de los que roban en una tienda se asocia 
con alguna característica demográfica particular. 


7.6 FORMAS DE RESPUESTA 


Una vez que el contenido de las preguntas individuales se determine, el investi- 
gador necesita decidir la forma particular de la respuesta. La pregunta será 
abierta o con alternativas fijas. Si es de alternativas fijas será una dicotomía, una 
multicotomía o quizá una escala. 


7.6.1 Preguntas abiertas 


Los entrevistados están en libertad de contestar a las preguntas abiertas con sus 
propias palabras y no a limitarse a escoger entre una serie de alternativas. 


Ejemplos: 


+ ¿Cree usted que las leyes limitan la cantidad de intereses comerciales que 
pueden cargarse al consumidor cuando es necesario? 

+ ¿Quién patrocina los partidos de futbol? 

+ ¿Cree usted que su trabajo beneficia al país? 

+ ¿Cuántos hijos tiene usted? 


Estas preguntas miden la escala de la información primaria que podría 
recopilarse de las características demográficas por medio de actitudes, inten- 
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ciones y comportamientos. La respuesta abierta es indudablemente un consejo 
versátil. 

Las preguntas abiertas se utilizan frecuentemente al comenzar un cues- 
tionario. En general, se cree que es mejor proceder de lo general a lo específico 
al redactar los cuestionarios; por ejemplo, una pregunta abierta como “Cuando 
usted piensa en aparatos de televisión, ¿qué marcas recuerda”?” Las preguntas 
abiertas dan una luz al marco de referencia del entrevistado y pueden ser muy 
útiles cuando se estén interpretando las respuestas individuales de preguntas 
posteriores; se usan también frecuentemente para probar información adicional. 
Las pruebas del porqué, por qué siente así y por favor explique, se utilizan fre- 
cuentamente para buscar que el entrevistado profundice sobre las respuestas. 

En general, el tipo de preguntas que se usan en un cuestionario depende de 
varios factores tales como la forma de recopilación de datos, naturaleza de la 
información requerida, objetivo de la investigación, conocimiento acerca del 
problema en estudio, la metodología de análisis de los datos que se han empeza- 
do a usar, etcétera. 


7.6.2 Preguntas cerradas 


En estas preguntas se sugiere al entrevistado dar las respuestas según las cate- 
gorías o alternativas de respuestas proporcionadas. 


Ejemplo: 
¿Se siente que usted realmente es parte del grupo de trabajo? 


+ Siempre se siente parte del grupo. 

+ Se incluye en la mayoría de las ocasiones. 
+ Se incluye en algunas de las ocasiones. 

+ No cree que pertenezca al grupo. 

+ No trabaja con ningún grupo. 

+ No está seguro. 


7.6.3 Preguntas multicótomas 


Las preguntas multicótomas son preguntas de alternativa fija. Se pide a los 
entrevistados escoger la alternativa más cercana a su posición de acuerdo con el 
sujeto, En la tabla 2 se presentan algunas de las preguntas abiertas colocadas 
antes de las preguntas multicótomas. Se les solicitará a los entrevistados que 
llenen los espacios que correspondan. Los ejemplos en la tabla 7.1 ilustran algu- 
nas de las dificultades que surgen al usar preguntas de opción múltiple. Por 
ejemplo, ninguna de las alternativas de la pregunta 2 puede capturar correcta- 
mente el verdadero sentimiento del entrevistado sobre el tema. La opinión 
individual puede ser más compleja por una razón: puede sentir que el interés de 
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la legislación es necesario considerando que un número de condiciones o contin- 
gencias posibles pueden satisfacerse; por ejemplo, que las firmas comerciales no 
reduzcan la cantidad de créditos disponibles a los consumidores ni la longitud 
del período de pagos. Si estas condiciones no pueden satisfacerse, el entrevista- 
do simplemente puede sentir lo opuesto. La pregunta de opción múltiple no per- 
mite que los individuos elaboren su posición verdadera, pero les pide que con- 
densen su actitud compleja a una sola declaración. Por supuesto, una serie de 
preguntas de opción múltiple bien diseñada, podría permitir tales elaboraciones. 
Una cobertura exhaustiva de calificaciones potenciales podría también incre- 
mentar notablemente la longitud del cuestionario. 

La pregunta de la compra del televisor (No. 3) ilustra un número de proble- 
mas asociados con las preguntas de opción múltiple. 

Primero, la lista de razones citadas para la compra de un televisor a color 
Philips puede ser no exhaustiva en las razones que podría usar el entrevistado; la 
persona que pudo haber comprado el televisor Phillips, y no lo hizo por lealtad a 
un amigo que posee la distribución local, o porque realmente hace la compra por 
el consejo de la Cámara de Comercio. La respuesta “otras” intenta resolver este 
problema, pero si muchos entrevistados marcan la categoría de “otras”, el estu- 
dio no servirá, por lo que dependerá del investigador hacer una lista de 
alternativas suficientemente variada, en una pregunta de opción múltiple. Esto 
implicará una cantidad alta de investigación previa del tema para una pregunta 
de opción múltiple. 

Segundo. A menos que usted dé instrucciones al entrevistado de marcar 
todas las alternativas que correspondan o de marcar por orden de importancia, la 
pregunta de opción múltiple también demanda que las alternativas sean 
excluyentes. Las categorías de los ingresos no se deben expresar de la siguiente 
forma 


U 1. 5,000 - 10,000 
12. 10,000 - 45,000 


ya que violan este principio. Un entrevistado con un ingreso de 10,000 no sabría 
qué alternativa marcar. Una respuesta legítima con respecto a la compra del tele- 
visor en color podría incluir algunas de las altemativas listadas. El entrevistado 
pensó que el color, garantía y precio eran más atractivos en Phillips que en otras 
marcas, así que las instrucciones necesariamente tendrían que ser: marque la 
razón más importante; marque todas las razones que correspondan o jerarquice 
las razones, desde la más importante hasta la menos importante. 

Una tercera dificultad con la pregunta de la compra del televisor es el gran 
número de respuestas alternativas posibles. La lista debe ser extensa, aunque la 
alternativa establezca que un individuo puede proceder simultáneamente, o 
puede ser limitada. Los investigadores en un estudio presentaron a cada entrevis- 
tado una tarjeta con seis alternativas. 
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Tabla 7.1 Ejemplos de preguntas multicótomas 


1. Edad: ¿Qué edad tiene usted? 


1, Menos de 20 
2, 20-29 

3, 30-39 

4, 40-49 

5, 50-59 

6.60 o más 


2. ¿Cree usted que las leyes limitan la cantidad de intereses comerciales 
que pueden cargarse a los consumidores cuando es necesario? 


E. Definitivamente necesario, 
2, Probablemente necesario. 

3. Probablemente innecesario. 
4. Definitivamente innecesario. 
5. No contestó. 


3, ¿Por qué compró un televisor a color marca Phillips? 


1, Precio más bajo que otros. 
2, Siente que representa la más alta calidad. 
3, Disponibilidad local de servicio. 

4. Disponibilidad de contrato de servicio. 
5. Mejor color. 

6. Mejor garantía. 

7. Otros, Especifique. 


popaDoo 


Cuando el entrevistado seleccionaba se reponía inmediatamente la tarjeta con 
otra. En la segunda tarjeta, dos de las 6 alternativas se cambiaron y una de la lista 
original se omitió. Sólo la mitad de los entrevistados pudo identificar Jos cambios 
y pocos localizaron la omisión. Tal vez una serie de preguntas es más apropiada 
que una sola; si hay muchas alternativas a una sola pregunta, éstas deberán 
mostrarse al entrevistado utilizando tarjetas y no simplemente leyéndolas.1 


4 Cantrill, Hadley y Fried, Edrteta, Ganging Public Opinion, Princeton University Press, Princeton. 
NJ, 1944, p. 93. 
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La cuarta debilidad de la pregunta de la compra del televisor es que es sus- 
ceptible a un orden potencialmente predispuesto. Los entrevistados tienden a 
marcar ya sea la primera o la última alternativa en una lista con alta concen- 
tración de respuestas. El procedimiento recomendado para evitar este orden 
predispuesto es preparar varias formas de cuestionario o varias tarjetas, si se 
usan las tarjetas para listar las alternativas; en todo caso el orden de las alternati- 
vas se altera de una forma u otra. Si cada alternativa aparece una vez en los 
extremos de la lista, otra vez en el centro y otra en donde sea, el entrevistador 
puede sentirse razonablemente seguro de que los posibles efectos de la predis- 
posición se han neutralizado. 


7.6.4 Preguntas dicótomas 


Las preguntas dicótomas también son de alternativa fija, pero hay sólo dos alter- 
nativas. 


Ejemplo: 


¿Creé usted que las leyes limitan la cantidad de intereses comerciales que 
pueden cargarse a los consumidores cuando es necesario? 


E, Sí 
2. No 


Yo 


Las preguntas dicótomas son fáciles de codificar, posiblemente por esto es 
que su uso se ha generalizado. 

Las fallas de las preguntas dicótomas se indican en los siguientes ejemplos: 

Suponga que se pregunta a los empleados de una oficina: ¿ha pensado com- 
prar un auto durante este año? 


L Sí 
2, No 


== 


Debido a problemas económicos y sociales es posible que un alto porcentaje 
de ellos pudiera haber respondido que no sabe o que no está seguro. Como las 
preguntas dicótomas no proporcionan tales alternativas, pueden crear sesgos en 
los datos. Es importante proporcionar alternativas para los que no quieren 
Opinar, no tienen preferencia, son indiferentes, etcétera. 


7.6.5 Características de las preguntas abiertas 


Como el entrevistado tiene libertad de contestar la pregunta, esta acción tiene 
ventajas y desventajas. 
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La ventaja más importante de este tipo de preguntas es que proporciona 
datos con amplia perspectiva, Como el entrevistado responde con sus palabras, 
esto permitirá evitar el sesgo. 

Una de las desventajas más conocidas es el sesgo de verbosidad. Ocurren 
sesgos de verbosidad cuando algunas respuestas son más largas y complejas. Las 
preguntas abiertas en comparación con preguntas cerradas requieren más tiempo 
para contestar; a veces se enfrentan a no tener suficiente espacio. La inter- 
pretación de las preguntas abiertas es relativamente difícil y costosa. El análisis 
estadístico de las preguntas abiertas es complejo porque impiden usar cualquier 
análisis estadístico. Por lo general, los análisis estadísticos más comunes que se 
usan son la tabulación y el cálculo de frecuencias medias, mediana y otras 
estadísticas descriptivas, 

No obstante las desventajas mencionadas, hay situaciones en la investi- 
gación en las que las preguntas abiertas son muy útiles. 


7.6.6 Formato de las preguntas 

El formato general consiste en presentar todas las posibles respuestas y que el 
entrevisado marque la apropiada categoría. Puede poner un círculo alrededor, 
marcar con una X o llenar el cuadro frente a su respuesta. 

Ejemplo: 


¿Cuál es su ocupación? 


1. Empleado de gobierno 1. Empleado de gobierno 1. Empleado de gobierno 


2. Empleado de “X” Compañía 2, Empleado de “X” Compañía 2. Empleado de “X” Compañía 


3. Comerciante 3. Comerciante 3. Comerciante 
4. Conductor 4, Conductor 4, Conductor 
5. Otro, Especifique — 5. Otro, Especifique — 5. Otro, Especifique 


Por supuesto, el cuestionario tendrá una guía para indicar cómo se deben 
marcar las respuestas. Entre estas tres alternativas, la primera (marcar el número 
de la respuesta) es más recomendable. 


Clasificación 


Uno de los formatos más comunes para preguntas contestadas en los estudios de 
las ciencias sociales es la escala de clasificación. La escala de clasificación se 
usa siempre que Jos entrevistados son interrogados acerca de su opinión en tér- 


minos de series de categorías tales como: “muy de acuerdo”, “favorable”, “muy 
frecuente”. 
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Ejemplo: 


Un incentivo monetario a los encargados de control de calidad aumentará la cali- 
dad de la producción. 


1. Muy de acuerdo. 

2. De acuerdo. 

3. Desacuerdo, 

4, Muy en desacuerdo. 
5, No opinó. 


Las categorías de respuestas a tales preguntas se denominan cuantifi- 
cadores; éstos reflejan la intensidad del juicio implícito particular. Las siguientes 
series de categoría son muy comunes: 


1. Muy de acuerdo. 1. Muy poco. 1. Más. 
2. De acuerdo. 2, Suficiente, 2. Más o menos. 
3. Ni de acuerdo 3, Mucho. 3. Menos. 


ni en desacuerdo. 
4. En desacuerdo. 
5. Muy en desacuerdo. 


Los códigos numéricos que acompañan a estas categorías usualmente se 
interpretan como intensidad de la categoría de respuesta, ya que mientras mayor 
sea el número, mayor será la intensidad de respuesta. Se debe enfatizar que 
aunque se está suponiendo que los cuantificadores se ordenarán según la intensi- 
dad, el orden no implica distancia entre ellos. En efecto, la escala de clasi, 
cación, como se observa, se medirá en nivel ordinal. 


7.6.7 Matriz de preguntas 


Es un método para organizar una gran serie de preguntas de clasificación que 
tienen las mismas categorías de respuesta. A continuación se presenta un ejempío: 

Con cuál de las siguientes declaraciones está usted: 1) muy de acuerdo, 2) de 
acuerdo, 3) ni de acuerdo ni en desacuerdo, 4) en desacuerdo, 3) muy en 
desacuerdo. 


Mi voto me dará todo el poder que necesito en el sindicato. 
(-) Muy de acuerdo ()Deacuerdo — ( )Nideacuerdo ni en desacuerdo — ( ) Muy en desacuerdo 


Trabajar seis horas al día aumentará la productividad, 
£ ) Muy de acuerdo ()Deacuerdo — ( )Nideacuerdo mien desacuerdo — ( ) Muy en desacuerdo 


Pagar el aguinaldo a los trabajadores trimestralmente ayuda a la economía de los trabajadores. 
( ) Muy de acuerdo ()Deacuerdo — ( )Nideacuerdo ni en desacuerdo — ( ) Muy en desacuerdo 
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La tarjeta clasificadora 

Otra manera de medir la intensidad de juicio es la tarjeta clasificadora, donde el 
entrevistado maneja tarjetas con una frase (o declaración) en cada tarjeta y se le 
pide que las clasifique dentro de un serie de siete cajas, dependiendo de su grado 


de conformidad con las frases (o declaraciones). 


Ejemplo: 


¿Qué tan de acuerdo está con la siguiente afirmación? 


Las personas que tienen capacidad de trabajar pero no Jo hacen, son como una 
fuga de energía para la sociedad. 


Muy de Muy en 
acuerdo desacuerdo 


7.6.8 La diferencia semántica 

La diferencia semántica es otro tipo de escala de clasificación. Mide la reacción 
del entrevistado a algunos objetos o conceptos en términos de clasificación sobre 
escalas bipolares definidas con objetivos contrastantes en cada extremo. 


Buena Mala 


3 2 1 0 1 2 3 


El “0” es el punto neutro de la escala, la posición 1 - 3 mide la intensidad o 
la dirección 


7.6.9 Ordenamiento 
Se utiliza siempre que se desee obtener la información considerando el grado de 


importancia de la serie de prioridades que la gente da a una serie de actitudes u 
objetos. 


$ Heise, David. The semantic differential and atittude research, in Medición de actitudes. Chicago 
Menally, 1970, pp. 235-253, 
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Ejemplo: 
Por favor díganos qué es para usted importante en la vida: 


A) Una vida próspera (ganar determinada cantidad de dinero y adquirir lo 
que desea). 

B) Una vida importante (una vida con importantes realizaciones, en la que 
tenga respeto y reconocimiento). 

C) Una vida segura (es decir, en la que pueda satisfacer sus necesidades 
básicas): 


ler, orden 
20. orden 
3er. orden 
40. orden 


7.7 DECISIÓN SOBRE LA REDACCIÓN DE LA PREGUNTA 


El paso 5 en el proceso de desarrollo del cuestionario incluye la redacción, las 
palabras empleadas en cada pregunta. Ésta es una tarea importante, ya que el 
vocabulario mal empleado puede hacer que los entrevistados se rehúsen a con- 
testar a pesar de que hayan aceptado cooperar con el estudio, o bien que 
contesten incorrectamente, ya sea a propósito o porque no entienden. La primera 
condición, que se conoce como de no respuesta puede crear muchos problemas 
al analizar la información; la segunda condición produce errores en la medición, 
ya que los parámetros obtenidos no igualan el parámetro de la respuesta del 
entrevistado. Lamentablemente, a veces es difícil preparar buenas preguntas; 
existen pocos principios básicos en los que los investigadores puedan apoyarse 
al estructurar las preguntas; en cambio, en la literatura abundan reglas de redac- 
ción. Si bien estas reglas son frecuentemente más fáciles de establecer que de 
practicar, los investigadores necesitan estar conscientes de todo aquello alrede- 
dor de las palabras que se utilizan en una pregunta. 


7.7.1 Use palabras sencillas 


La mayoría de los investigadores enfrentan problemas de vocabulario, ya que 
como quizás los entrevistados tienen mejor preparación que aquellos para los 
que están elaborados los cuestionarios típicos, los investigadores tienden a 
emplear palabras conocidas pero que los entrevistados no entienden. Éste es un 
problema difícil porque no es sencillo conocer lo que uno sabe y ponerse en el 
lugar del entrevistado cuando se trata de asesorarlo en su vocabulario. Por ejem- 
plo, una proporción significativa de la población no entiende la palabra Cáucaso, 
a pesar de que la mayoría de los investigadores sí la conoce. El investigador 
debe establecer el nivel de educación de las cantidades poblacionales en estudio. 
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Lo básico es que las palabras sean sencillas. Cuando existe la posibilidad de 
escoger entre palabras sencillas y palabras menos conocidas, es mejor preferir la 
sencillez, 


7.7.2 Evite palabras y preguntas ambiguas 


Las palabras no solamente deben ser sencillas, sino que además, deben evitar la 
ambigiiedad. Lo mismo se aplica a las preguntas. Considérese otra vez la pre- 
gunta multicótoma: 


¿Qué tan seguido usa usted los accesorios de su auto? 


O Nunca. 

O Ocasionalmente. 
O Algunas veces. 

O Frecuentemente. 


Para propósitos prácticos, las respuestas a esta pregunta no tendrán validez. 

Las palabras ocasionalmente, algunas veces y frecuentemente son 
ambiguas. Para un entrevistado la palabra frecuentemente puede significar “cada 
vez que maneja su auto” mientras que para otro puede ser “sí, los uso cuando 
tengo la necesidad específica”, Esto ocurre en uno de cada cuatro proyectos. 

La palabra ocasionalmente y algunas veces también se podría interpretar en 
forma diferente por distintos entrevistados; por lo tanto, si la pregunta obtuviera 
respuestas, generaría un pequeño malentendido real de la frecuencia real de usar 
los accesorios de un auto. 

Una estrategia mejor sería proporcionar alternativas concretas en lugar de 
las opciones ambiguas anteriores. Las alternativas podrían ser, por ejemplo: 


¿Qué tan seguido usa usted los accesorios de su auto? 


O Nunca los uso. 

E Los uso aproximadamente en uno de cada diez viajes. 
O Los uso aproximadamente en uno de cada tres viajes. 
Ol Los uso en casi cada viaje. 


Si éstas son las categorías apropiadas, dependerán del propósito del estudio. 
Lo importante es que el investigador proporcione un marco consistente de refe- 
rencia para cada entrevistado. Los entrevistados ya no pueden tener la libertad 
de imponer sus propias definiciones a las categorías de estas respuestas. 

Como alternativa para evitar la ambigiiedad entre las categorías de respues- 
tas cuando se pregunta la frecuencia de algún comportamiento, esta pregunta 
anterior se estructura de la siguiente manera: 
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La última vez que usted realizó un viaje largo, ¿usó los accesorios de su 
auto? 


Osí 0ONo O Norecuerdo 
7.7.3 Evite preguntas que influyan sobre el entrevistado 


Una pregunta que influye sobre el entrevistado es aquella que se estructura de tal 
manera que da al entrevistado la clave de cómo responder. 


Ejemplo: 


¿Piensa usted que un incentivo monetario será conveniente para reducir la 
tasa de productos defectuosos? 


Osí 0ONo [] Nosé 


Por supuesto, la redacción correcta de ésta o cualquier otra pregunta 
podría someterse a discusión. El punto importante tanto para investigadores 
como gerentes es recordar que las palabras finalmente escogidas impactarán las 
respuestas aseguradas. Si realmente se desea un panorama exacto de la situación, 
es necesario evitar influenciar al entrevistado en las preguntas que se le hagan. 


7.7.4 Evite alternativas implícitas 


Una alternativa implícita es aquella que no se expresa en las opciones; considé- 
rense a continuación dos preguntas que se utilizaron en dos muestras al azar 
compuestas por amas de casa que no trabajan fuera del hogar, con la finalidad de 
investigar sus actitudes respecto a tener un empleo fuera de su casa. 


1. ¿Le gustaría tener un empleo si fuera posible? 
2. ¿Prefiere tener un empleo o simplemente prefiere trabajar por su cuenta? 


Aunque las dos preguntas son muy similares, produjeron respuestas total- 
mente diferentes: la primera versión indicó que al 19% no le gustaría tener un 
empleo, mientras que la segunda sugería que 68% prefería no tenerlo. 

La diferencia entre las dos preguntas es que la versión 2 hace implícita la 
alternativa implicada en la versión 1. 

Como regla general se deben evitar las alternativas implícitas, a menos que 
haya una razón para no impedirlas. 

Es más, debido a que el orden en que aparezcan las alternativas puede afec- 
tar las respuestas, debe rotarse el orden de las opciones en los cuestionarios de 
muestra, 
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7.7.5 Evite suposiciones implícitas 


Con frecuencia, las preguntas se estructuran de tal manera que hay una suposi- 
ción implícita en cuanto a lo que pasará como consecuencia. La pregunta es: 
¿Está usted a favor de que exista un control de precios del petróleo crudo? 

Provocará diferentes respuestas de los individuos dependiendo de sus pun- 
tos de vista acerca de lo que podría producir en el racionamiento de la gasolina, 
largas colas de autos, etcétera. 

Una mejor manera de formular la pregunta es hacer explícitas las conse- 
cuencias. Así, la pregunta se alteraría para preguntar: ¿Está usted a favor de que 
exista control de precios del petróleo crudo si se sabe que esto causará 
racionamiento de la gasolina? 


7.7.6 Evite las generalizaciones y las estimaciones 


Las preguntas siempre deben hacerse en forma específica y no en términos gene- 
rales. Considere la pregunta a un agente de compras: ¿Cuántos vendedores lo 
visitaron el año pasado? 

Para contestar esta pregunta, el agente tendría que calcular cuántos vende- 
dores lo visitan cada semana, y multiplicar este valor por 52, para obtener los 
datos y contestar tal pregunta. Esta carga no debe imponérsele al entrevistado; es 
mejor calcular ciertos valores semanales como opción a 52, obteniendo datos 
anuales, 


7.7.7 Evite preguntas de doble sentido 


Una pregunta de doble sentido es aquella que puede darle dos respuestas; por lo 
tanto, crea confusión en la mente del entrevistado. La pregunta “¿Cuál es su eva- 
luación del precio y la conveniencia que ofrece el catálogo de salas de 
exposición?” está pidiendo a los entrevistados que reaccionen hacia dos atribu- 
tos por separado, según los cuales podría describir las salas de exposición, Por 
ejemplo, el entrevistado podría sentir que los precios son atractivos pero el lugar 
no, y entonces se produce el dilema de cómo responder. El problema es particu- 
larmente crítico si el individuo debe escoger una respuesta de una serie fija de 
alternativas. Uno debe evitar preguntas separadas. Un indicador útil de que se 
pueden necesitar dos preguntas es la palabra “y” utilizada en la pregunta. 


7.8 DETERMINAR LA SECUENCIA DE LAS PREGUNTAS 


Una vez que la forma de respuesta y las palabras específicas para cada pregunta 
se han decidido, el investigador puede empezar a estructurarlas en el cues- 
tionario. El investigador necesita reconocer inmediatamente que el orden en el 
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que se presenten las preguntas puede ser crucial para el éxito del esfuerzo del 
estudio. Nuevamente no hay principios básicos sino únicamente una regla que 
orienta al investigador en esta actividad. 


7.8.1 Utilice preguntas de apertura 
, simples e interesantes 


Las primeras preguntas que se hacen son cruciales; si el entrevistado no puede 
responder fácilmente las primeras preguntas por hallarlas poco interesantes, sus- 
picaces o amenazadoras, puede rehusarse a completar el resto del cuestionario. 
Por lo tanto, es esencial que las primeras preguntas sean simples e interesantes y 
que de ninguna manera comprometan al entrevistado. 

Aquellas preguntas que solicitan una opinión a los entrevistados establecen 
frecuentemente una buena introducción, ya que la mayoría de las personas sien- 
ten que su opinión es importante. Algunas veces es útil usar dichas 
introducciones aunque las respuestas no se analicen, ya que las preguntas de 
opinión hacen que el entrevistado no se sienta nervioso y pueda hablar libre- 
mente. 


7.8.2 Use métodos encauzados 


Este método recibe su nombre en su propia forma ya que comienza con pregun- 
tas amplias y las estrecha progresivamente. Si se le va a preguntar al 
entrevistado qué ajustes se necesitan en las políticas de la empresa y además que 
si está de acuerdo con el servicio, es necesario plantearle la primera pregunta 
antes que la segunda; de otra manera, la calidad del servicio se enfatizará en 
forma desproporcionada en las respuestas, simplemente porque está fresca en la 
mente del entrevistado. 

También debería existir cierto orden lógico en las preguntas. Esto significa 
que deben evitarse cambios repentinos en los temas y pasar de tema a tema. 

Algunas veces se necesitan recursos de transición para suavizar la fluidez 
cuando ocurre un cambio de tema. En ocasiones, la simple inserción de pregun- 
tas apropiadas servirá muy bien para este propósito, aunque la inserción de una 
breve explicación es el puente más comúnmente utilizado cuando se produce un 
cambio de tema. 

Entonces, se puede llegar a la conclusión de que, en general, se han encon- 
trado dos tipos de secuencia de preguntas que son apropiadas para motivar a los 
entrevistados a cooperar: 


1. La secuencia de embudo (cada pregunta sucesiva está relacionada con la 
anterior y tiene un alcance más estrecho). 

2. La secuencia de embudo invertido (a las preguntas más estrechas las 
siguen unas más amplias). 
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7.9 EVALUACIÓN Y PRUEBA DEL CUESTIONARIO 


A pesar de todas las precauciones durante el desarrollo del cuestionario, todavía 
£s necesario revisar, en esta última etapa, las preguntas tanto en forma individual 
como general. 

Tanto el diseño como la consecuencia de las preguntas deben evaluarse. 

Es importante que el cuestionario se examine antes de aplicarlo para asegu- 
rar su comprensión. Se debe tomar una muestra muy pequeña de la población 
en estudio, aplicarla y medir el grado de comprensión y posible modificación del 
cuestionario. Este proceso se conoce como prueba piloto. Es recomendable 
grabar algún caso en el proceso de prueba piloto para analizarlo posteriormente 
y evaluar las preguntas, efectuar todas las correcciones y modificaciones y 
después aplicar el cuestionario evaluado y probado a la población en estudio. 


$ Como ejemplos de cuestionario puede consultar: 

a) Namakforoosh, Mohammad Naghj P., Judith Saldaña S. Administración de los programas de 
planificación familiar. Limusa, México, 1983. 

b) Namakforoosh, Mohammad Naghi P.. Ibarreche, Santiago, Mercadotecnia Social, Limusa. 
México, 1993. 


CAPÍTULO 


8 


Muestreo 


8.1 INTRODUCCIÓN 


Una vez que el investigador ha especificado ei problema con claridad, ha ela- 
borado un diseño apropiado del estudio y los instrumentos para recopilar datos, 
el paso siguiente será seleccionar los elementos de los cuales recopilará los 
datos, y los elementos de una población de la que desea medir ciertos factores. 
También se pueden recopilar datos de todos los elementos de una población. A 
esto se le denomina censo. 

En términos de investigación, una población no sólo se refiere a la gente, 
sino que puede ser una empresa manufacturera, una industria, un sindicato, un 
grupo de empleados, etcétera. En otras palabras, la población es el total del caso 
del estudio. Es importante definir la población en estudio, hasta el nivel de 
grupo específico dentro de una población. Suponga que se decide conocer el 
perfil de los usuarios del transporte colectivo; es necesario especificar a quién se 
debe considerar como usuario: los que una vez en su vida usan el sistema de 
transporte colectivo, los que lo usan una o dos veces a la semana, o los que lo 
usan diariamente. 

En este capítulo se explica el porqué y el cómo realizar el muestreo y las 
diferentes técnicas que se utilizan para tomarlo. 


8.2 ¿POR QUÉ TOMAR UN MUESTREO? 


No es conveniente medir todos los elementos de una población en estudio por 
varias razones. 
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1. La medición de todos los elementos de una población requiere mucho 
dinero y tiempo. 

2. Como la medición de todos los elementos de una población requiere de 
mucho tiempo, cuando termina la etapa de recopilación de datos, la in- 
formación captada no tendrá la misma validez, debido a posibles 
cambios. 

3. El censo paralizará todo el proceso normal de la vida de la población; 
por ejemplo, si se decide probar la durabilidad de todas las lámparas pro- 
ducidas por una fábrica, se paralizará la salida de toda la producción al 
mercado. 


El censo requiere de un número elevado de recopiladores de datos, pero 
existe la confianza de que no hay error de muestreo. Realmente, rara vez se rea- 
liza un censo en un estudio científico; con un muestreo adecuado se puede 
inferir y dar conclusiones para toda la población con ciertos grados de confiabi- 
lidad, en ciertos intervalos. 


8.3 CÓMO TOMAR UN MUESTREO 


Para tomar un muestreo se requiere seguir ciertos pasos (ver figura 8.1). Es 
necesario definir primero la población en estudio, las causas que se van a estu- 
diar, además de especificar qué unidades de la población hay que excluir; es 
decir, fijar un mínimo de límite geográfico y de período, 


Definir la población 
Identificar el marco muestral 
Elegir el procedimiento 


Determinar el tamaño 


Seleccionar los elementos 
de estudio 


Figura 8.1 


TIPOS DE MUESTREO 137 


A veces existen limitaciones adicionales, sobre todo cuando la población en 
estudio se trata de gente; por ejemplo, entre trabajadores de una fábrica hay que 
especificar su sexo, edad, credo, etcétera. 

La segunda etapa en el proceso del muestreo es identificar el marco mues- 
tral, o sea elaborar una lista de los elementos de la población de los cuales se 
toma el muestreo. Un directorio empresarial puede ser un buen ejemplo del 
marco muestral. 

La tercera etapa es elegir el proceso para tomar el muestreo, lo cual tiene 
estricta relación con el marco muestral, su tamaño y lo que el investigador pre- 
tende hacer; por ejemplo, el método de muestreo aleatorio simple necesita una 
lista completa, adecuada y reciente de los elementos de la población en estudio. 
El resto del capítulo se dedica a explicar los modelos principales para muestrear. 

La cuarta etapa es determinar el tamaño de muestreo; al final de este capítu- 
lo se explica esta etapa. 

La quinta y última etapa consiste en elegir los elementos por estudiar. 


8.4 TIPOS DE MUESTREO 


Las técnicas de tomar un muestreo se pueden dividir en dos tipos generales: 
muestreo probabilístico y muestreo determinístico. 

El muestreo probabilístico es un muestreo en el cual todos los elementos de 
la población tienen posibilidad de ser seleccionados. Se debe mencionar que no 
es necesario que la posibilidad sea igual, porque se puede especificar la posibi- 
lidad de seleccionar algunos elementos de la población y estimar la posibilidad 
de que un elemento de la población sea seleccionado. No hay manera de asegu- 
rar que el muestreo sea representativo. Todas las técnicas muestrales determinís- 
ticas están basadas en el juicio personal del investigador. En efecto, es posible 
que estos juicios personales sean una buena estimación de las características de 
la población, pero los modelos determinísticos de muestreo no permiten evaluar 
su grado de exactitud. 

Hay otos tipos de muestreo que el investigador debe conocer y seleccionar 
para el tipo de muestreo que desea usar. 

El muestreo puede ser fijo o secuencial. El muestreo fijo implica un 
muestreo de tamaño constante que se determinó antes de recopilar datos; mien- 
tras que en el muestreo secuencial, el tamaño de muestreo no es fijo, y se recopi- 
lan datos secuencialmente, o sea después de la recopilación de datos, si no se 
logró suficiente evidencia para tomar decisiones necesarias con las informa- 
ciones que se tienen, continuarán recopilándose más datos; una vez más se veri- 
ficará si se obtuvo suficiente evidencia; si no, se continuarán recopilando datos 
hasta que se llegue a un punto en que se encuentre la evidencia necesaria para la 
toma de decisión. 

El muestreo puede ser sin reemplazo o con reemplazo. En el nuestreo sin 
reemplazo cada elemento muestral de la población tiene una sola oportunidad de 
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Probabilístico 


Determinístico 


— Aleatorio simple 
—Estratificado 


- Proporcional — Convencional o 


—No proporcional 
A) 


— Por grupo (cluster) 


- Sistemático 


— Por área 
Figura 8.2 


ser seleccionado, mientras que en el muestreo con reemplazo cada elemento 
muestral de la población puede ser elegido varias veces. 

Las técnicas para tomar un muestreo en su clasificación amplia (probabi- 
lísticas y determinística) se pueden dividir en otros tipos; por ejemplo, el mues- 
treo determinístico puede ser convencional, intencional y de cuota; el muestreo 
probabilístico se divide en: muestreo aleatorio simple, muestreo estratificado (pro- 
porcional y desproporcional) y muestreo por grupos (sistemático o por área). 
Ver figura 8.2. 


8.5 MUESTREO DETERMINÍSTICO 


Por lo general, el muestreo determinístico implica un juicio personal, algunas 
veces el del investigador, y otras el del recopilador de datos. 


8.5.1 Muestreo convencional o accidental 


El muestreo convencional se refiere a recopilar datos de los sujetos de estu- 
dio más convenientes, o sea, recopilar datos de los elementos muestrales de la 
población que más convengan. Un ejemplo muy popular es entrevistar a cual- 
quier persona que pase por la calle, y pedirle su opinión respecto a, por ejem- 
plo, algún tema político de actualidad, o que algunos investigadores pidan a los 
alumnos de un salón que contesten cierto cuestionario. 

Este muestreo es muy rápido y cuesta poco, pero también tiene ciertas de- 
ficiencias. La opinión de los alumnos de un salón o de cualquier persona, no 
puede ser representativa de la población en estudio. 
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Este tipo de muestreo es recomendable solamente en el proceso de un estu- 
dio exploratorio que trata de definir el camino de la investigación. 


$.5.2 Muestreo intencional 


En el muestreo intencional todos los elementos muestrales de la población serán 
seleccionados bajo estricto juicio personal del investigador. En este tipo de 
muestreo el investigador tiene previo conocimiento de los elementos pobla- 
cionales, 

Aunque este muestreo es subjetivo, requiere que el investigador conozca los 
elementos muestrales, lo que permite que el muestreo sea representativo. 


Ejemplo: 


Suponga que la población en estudio está formada por varias fábricas que com- 
pran materia prima en la empresa X. Posiblemente el investigador tiene expe- 
riencia o ha realizado estudios sobre cuáles de ellas deben seleccionarse, según 
características bien definidas de tamaño, lugar, productos, estructura empresa- 
rial, etcétera, que pueden proporcionar más información. 

Entonces, el muestreo intencional se caracteriza por el empleo del criterio y 
por un esfuerzo deliberado para obtener muestras representativas mediante la 
inclusión de áreas típicas o grupos supuestamente típicos en la muestra, 


$.5.3 Muestreo por cuota 


En el muestreo por cuota se utilizan los datos de los estratos de la población, 
sexo, raza, religión u otros, para seleccionar miembros de la población que sean 
representativos, típicos o adecuados para algunos fines de la investigación. El 
Muestreo por cuota recibe su nombre de la práctica de asignar cuotas o propor- 
ciones de clases de personal a los entrevistados. Por ejemplo, suponga que se 
desea saber la opinión de los jóvenes adolescentes de Zacatecas respecto a la 
revista Agrícola X. Si se consulta el censo de 1980 se sabrán ciertas característi- 
cas poblacionales como se indica en la tabla 8.1. 


Tabla $,1* 
Edad T Sexo Distribución 
] poblacional 
Total. M F 
Rural Urbana 
15 años o menos 135,462 69,562 65.900 49,535 85,927 
16 años o más 171.906 i 86.454 | 85,452 55,739 116,167 


* Los datos son ficticios. 
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Para continuar el procedimiento se necesitan unas “cuotas”, es decir, nú- 
mero de adolescentes en cada categoría de sexo, edad y distribución pobla- 
cional. 

Se desea determinar la probabilidad de que un adolescente de 15 años de 
edad o menos, masculino, sea residente de zonas rurales. Después se determina 
la probabilidad de que un adolescente de 16 años o más, masculino, viva en 
zonas rurales; se continúa así hasta que se determinan las probabilidades de las 
ocho diferentes categorías de edad, sexo y distribución poblacional (residencial). 
El resultado se indica en la tabla 8.2. 


Tabla 8.2. Porcentaje de adolescentes por edad, sexo y distribución poblacional. 


Masculino Femenino 
Edad Rural Urbano Rural Urbano 
15 años o menos 7.66 14.71 7.43 14,27 
16 años o más 9.72 18.67 9.43 18.11 


Ahora se redondean estos porcentajes dando las cuotas o número de muestreo 
que se debe levantar en cada categoría de población; ver tabla 8.3. 


Tabla 8.3, Tamaño de muestreo de adolescentes por edad, sexo y distribución pobla- 
cional. 


Masculino Femenino 
Edad Rural Urbano Rural Urbano 
15 años o menos 3 15 7 14 
16 años o más 10 19 9 18 


Se deben dar instrucciones a quienes entrevistan a la gente según las cuotas. 

Hay otros factores que se pueden controlar en un muestreo por cuota, tales 
como: área geográfica, ingreso, etcétera. Como se indica, el muestreo por cuota 
tiene la ventaja de ser representativo. Este muestreo se ha empleado mucho en 
encuestas de opinión pública. 


8.6 MUESTREO PROBABILÍSTICO 


El muestreo probabilístico, comparado con el muestreo determinístico, tiene dos 
características distintas: 
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1. Todos los elementos muestrales de la población tienen la misma posibili- 
dad de elegirse. 

2. Se deben usar unos instrumentos de aleatoriedad para seleccionar al 
sujeto en estudio. 


Por sus características, el muestreo probabilístico es más objetivo que el de- 
terminístico, pero también es más costoso, requiere de más tiempo y es más difí- 
cil de aplicar; además, no hay ninguna garantía de que el muestreo probabilístico 
sea más representativo. 

La ventaja principal del método probabilístico de tomar un muestreo es que 
se puede estimar el error muestral o grado de precisión asociado con los datos 
recopilados; en otras palabras, como el procedimiento de seleccionar elementos 
de la población para el estudio es probabilístico, todo el procedimiento está suje- 
to a leyes de probabilidad, o sea que se puede calcular el intervalo de confianza 
(ver apéndice del capítulo).* 


8.7 CONCEPTOS BÁSICOS DE MUESTREO 
PROBABILÍSTICO 


Para facilitar el entendimiento del proceso de muestreo probabilístico, es conve- 
niente recordar ciertos conceptos estadísticos. 

Si en lugar de tomar un muestreo se estudian todos los miembros de la 
población (censo), a las características estudiadas o valores obtenidos se les 
conoce como parámetros; por definición, los parámetros tienen un valor fijo o 
constante, Si se seleccionan unos miembros de la población (muestreo) y se 
estudian los datos obtenidos, se llama estadística y sirve para hacer inferencias a 
los parámetros. El valor que toman las estadísticas varía de muestreo a mues- 
treo. Como se mencionó, los parámetros son fijos para distinguir diferentes 
poblaciones. Suponga que la compañía X quiere conocer la tendencia política de 
sus empleados de nivel ejecutivo y que tiene 20 empleados en este nivel, la tabla 
proporciona datos como ingreso, experiencia y su afiliación a dos partidos políti- 
cos, X y Y. 

Se puede calcular el promedio de ingreso semanal, la dispersión de la varia- 
ble de experiencia, la proporción de miembros de cada partido político, etcétera. 
Estas cantidades son fijas en valores; si se levanta un censo, simplemente se 
pueden calcular estos parámetros. En lugar de levantar un censo, usualmente se 
toma un muestreo y se utilizan valores calculados en el muestreo para estimar 
los parámetros (valores para la población). Ver tabla 8.4 en la siguiente página. 

Para calcular las estadísticas (los valores del muestreo) se usan las mismas 
fórmulas que se utilizan para estimar los parámetros; se debe saber que el valor 
estadístico depende de diferentes muestreos seleccionados de una población, es 
decir, que de una población se pueden tomar diferentes muestreos, cada uno con 
diferentes estadísticas y estimaciones. 
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Tabla 8.4, Población hipotética. 
Miembros Ingreso Experiencia Miembro de 
semanal años partido 
1A 5.600 38 x 
2B 6.000 9 Y 
30 6,400 1 x 
4D 6.800 1 Y 
SE 7,200 1 x 
6F 7.600 1 Y 
76 8,000 2 Xx 
sH 8,400 12 Y 
91 8.800 12 x 
103 9.200 12 Y 
MK 9,600 13 x 
2L 10,000 13 Ye 
13M 10,400 14 x 
14N 10,500 14 Y 
150 11,200 15 x 
16P 11,600 16 Y 
170 12,000 16 Xx 
18R 12,400 7 Y 
19s 12,800 18 Xx 
20T 13,200 18 Y 


Se va a considerar todo posible muestreo que se puede tomar de la pobla- 
ción de nuestro ejemplo (ejecutivos en la compañía X) con un muestreo de 
tamaño 2 (n = 2) con el método aleatorio simple. Sin reemplazo, hay 190 com- 
binaciones de 20 empleados tomándolos de 2 en 2, y para cada combinación se 
puede calcular el promedio muestral de ingreso, por ejemplo, el muestreo AB, 


X4 = (5,600 + 6,000) / 2 = 5,800). Ver la tabla 8.5. 


Tabla 8.5, Conceptos básicos de población y muestreo. 


7 


2% 
¿Ei _ (5:600 + 6,000 +... + 13,200) — 9 400 
N 20 Ú 


p- 
donde ¡4 = promedio aritmético de la población 
NS 
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— (S:600 — 9.400P? + (6.000—9.400? , (13,000 — 9.400 
2 20 


= 5'320,000 
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La dispersión de los miembros de la población hacia el promedio pobla- 
cional: a = + Va? la raíz cuadrada positiva de la varianza, que es la desviación 
estándar de la población, es un medio de dispersión 


Xí = Valor de la ¡-ésima observación. 
N_ = Número de miembros de la población. 


Los mismos cálculos se pueden aplicar para determinar los valores del 
muestreo (estadística) que servirán para estimar los parámetros. 


= Promedio aritmético de un muestreo particular 
tomado de una población. 


ys 


" 
Il 


= Varianza o dispersión de los miembros pobla- 
cionales de un muestreo particular hacia un 
promedio muestral 


Ss = +v8 = Desviación estándar muestral. Es la raíz cua- 
drada positiva de la varianza mucstral; es una 
medida de dispersión 


n = Número de miembros de la población de mues- 
treo. 


8.8. COMPARACIÓN DEL PROMEDIO MUESTRAL CON 
EL PROMEDIO POBLACIONAL 


En la relación entre estos dos promedios se deben considerar tres puntos: 


1. Suponga que se suman todos los promedios muestrales de la tabla 8.4 y 
se divide el número de muestreo posible que se puede tomar, o sea 190, 
Obtendremos: 


(5,800 + 6,000 + 
190 


+ 13,000) _ 


9,400 


Como se puede notar, este promedio es igual al promedio poblacional, 
por lo que se puede clasificar como una estadística no sesgada. 

Una estadística se considera no sesgada cuando su promedio es 
igual a] promedio poblacional. Se debe notar que una estadística puede 
ser sin sesgo pero lejos del valor real de la población: por ejemplo, si se 
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selecciona AB y ST se tendrá la estadística igual al parámetro, es decir, 
una estadística sin sesgo pero lejos del promedio real o por ejemplo AT 
es un muestreo cuyo promedio es igual al promedio poblacional. 


. Hay una relación entre la varianza del muestreo y la varianza de la po- 


blación de una variable: la varianza del muestreo se puede obtener con la 
fórmula: 


eo ,N-a 
x n  N-1 


por ejemplo, la varianza muestral del ingreso sería 


(5600 — 9400 )? + (6000 — 9400) +...-+(13000 — 9400)? 
190 


= 2,520,000 


usando la varianza del ingreso poblacional (parámetro) y aplicando la 
fórmula antes mencionada se tendrá: 


2 20-2 . 
a x= = 
A 2-2 2'520,000 


|. Nótese la distribución de los valores de las estimaciones (estadística) en 


contraste con la distribución de la variable en la población. 

En la figura 8.3 se indica que la distribución de la variable es una 
línea recta porque cada uno de los valores ocurre en un mismo mes. 
Además, es simétrica respecto al promedio poblacional (A). La distri- 
bución de valores estimadores se ve como una curva, se trazó según 
el tamaño de la variable y la frecuencia. La figura 8.4 es es el histogra- 
ma que representa la distribución muestral. La distribución muestral 
es un elemento muy valioso e importante en estadística. Si se conoce 
la distribución muestral de la estadística sujeta a evaluación (por ejem- 
plo, promedio muestral del ingreso de los empleados de alto nivel de la 
compañía X) se pueden hacer inferencias para el parámetro poblacio- 
nal correspondiente. 


Figura 8.3. Distribución de ingreso en la población original y la distribución estimado 
muestral. 
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6 7 8 9 10 41 12 3 14 15 16 xXx 
En miles de pesos 


Figura 8.4, 


La distribución muestral de una estimación explica cómo varía el esti- 
mado tomando varios muestreos, por lo que proporciona una base para 
estimar la confiabilidad de los estimados; por esto, la muestra probabilísti- 
ca es muy importante porque permite hacer inferencias estadísticas. El 
investigador, basado en la distribución muestral, puede encontrar el medio 
muestral, la proporción, la varianza muestral y otras estadísticas que le per- 
miten hacer sus inferencias para toda la población en estudio. 


8.9 TAMAÑO DEL MUESTREO 


Hay varios conceptos equivocados respecto al tamaño del muestreo. Algunos 
dicen que el muestreo debe incluir al 2% de la población, otros que debe constar 
de unas 2,000 miembros de la población, y otros opinan que si el tamaño de la 
muestra es mayor, serán más precisos los resultados. Ninguna de estas opiniones 
es correcta. El tamaño de la muestra se puede estimar aproximadamente, toman- 
do en consideración el nivel de precisión o la cantidad de error que sea acep- 
table. 

Respecto al ¡muestreo secuencial, antes de tomar el muestreo, el investigador 
debe tomar el tamaño apropiado del muestreo con el que va a trabajar. Esto de- 
pende de la circunstancia en que se encuentre el proyecto de investigación y 
de muchos otros factores. 

Los factores que afectan la decisión respecto al tamaño del muestreo son: 


+ Cuanto más importante sea la toma de decisión usando los datos de la 
investigación, más grande será el muestreo requerido. 

» Cuanto más complejos y sofisticados sean los análisis estadísticos, más 
grande será el muestreo requerido. 
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+ Cuanto más numerosas sean las variables de la investigación, más gran- 
de será el muestreo requerido, a fin de minimizar el error acumulativo y 
muestral en las variables. 

+ Cuanto más heterogénea sea la población, respecto a la característica que 
interesa, mayor deberá ser el muestreo. 

+ Cuanto más grande sea la dispersión de la población, mayor deberá ser el 
muestreo, Por ejemplo, suponga que interesa determinar el promedio de 
edad de cierta población. Si el rango de edad es de 10 a 15 años, un 
muestreo pequeño dará una buena estimación de la edad de la población, 
pero si el rango es de 1 a 100 años, se necesitará un muestreo mayor. 

+» El tamaño de la población también influye en la selección del tamaño del 
muestreo; si el tamaño de la población es pequeño (manejable) se debe 
considerar un censo; pero si el tamaño del muestreo ha sido de una par- 
te considerable de la población, ya sea 10% o más, entonces se requiere 
ampliar la correlación finita de la población. La correlación finita de la 
población es un factor de ajuste, y se utiliza para bajar la varianza estima- 
da muestral cuando el tamaño del muestreo es grande en relación con el 
tamaño relativo de la población. La correlación finita de la población es 
igual a (1 — n/N) o (C — nYN para varianza muestral y (1 — n/N) para 
desviación estándar muestral. Se debe mencionar que cuando se toma un 
muestreo sin reemplazo y cuando la población es pequeña, se usan fac- 
tores de la correlación finita de la población para rebajar la varianza 
muestral y la desviación estándar.! 

El tamaño de intervalo de confianza también influye en el tamaño del 

muestreo. 


8.10 ERROR ESTÁNDAR O ERROR MUESTRAL 


La idea del error estándar es la base de la teoría del muestreo y es algo que 
ayuda a comprender cómo determinar el tamaño de la muestra. La idea principal 
del error muestral se puede aclarar con un ejemplo hipotético muy simple. 
Basaremos nuestra explicación en el "muestreo aleatorio simple”: 

Suponga que nuestro universo lo constituyen cinco personas: directores de los 
departamentos de Recursos Humanos, Mercadotecnia, Investigación y desarrollo, 
Producción, y Finanzas de una empresa, quienes ganan 5,000, 6,500, 4,000, 7,000, 
y 6,000 pesos cada mes, respectivamente, por lo que el promedio poblacional de 
los ingresos mensuales del universo muestral (población) es 4 = 5.700 pesos.? Se 
toma una muestra de dos personas, o sea n = 2 con el propósito de estimar la q. 


1 Cuando el muestreo es con reemplazo, la población se puede considerar infinitamente grande, 
cualquiera que sea el tamaño del muestreo, no requiere del factor de la correlación finita de la 
población. 

2 Para simplificar el cálculo se dividen todas las cifras entre cien. 
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Suponga que aleatoriamente se seleccionan dos personas, el director de 
Recursos Humanos y el de Investigación y desarrollo, que ganan $ mil y 4 mil 
pesos respectivamente cada mes. Se denota el promedio muestral como X, que, 
en nuestro ejemplo sería: 


5 (0440) _ 
2 


45 


éste se toma comio un estimador de 2. Pero como en este ejemplo se sabe que el 
pes igual a 57 (5700), se puede suponer que la estimación es inadecuada. 

Si la muestra extraída incluía a los directores de los departamentos de mer- 
cadotecnia y producción, cuyos ingresos son de 6500 y 7000, la estimación de 4 
hubiera sido de 6,750. Incluso esta estimación es incorrecta. Se refiere a la pre- 
cisión del muestreo en el grado en que sus valores están aproximadamente cerca 
de los valores de la población, es decir, si los estimadores presentan valores 
poblacionales más o menos verdaderos, se dice que el muestreo es adecuado, 
pero por lo general, los valores de la población se desconocen. 

Se considerarán todos los posibles muestreos de tamaño n = 2 que se 
puedan extraer de la población. Suponga que el muestreo se toma sin reemplazo, 
es decir, si se extrae un elemento de la población, el segundo elemento se tomará 
entre los cuatro restantes. Después de seleccionar el segundo elemento, se selec- 
ciona el tercero de los elementos restantes hasta el último. 

El promedio de la población, resultado de todas las posibles muestras es de 
570/10 = 57, que es igual a la media poblacional. 

El promedio de los estimadores de un parámetro poblacional, obtenido de 
un número infinito de muestras se conoce como "valor esperado de los esti- 
madores", En este caso es 57. El estimador es un método para estimar los 
parámetros poblacionales de los valores muestrales. Si el valor esperado del esti- 
mador es igual al parámetro poblacional, se considera un estimador no sesgado. 
Si el valor esperado del estimador no es igual al parámetro poblacional, se 
considera un estimador sesgado. La diferencia entre el valor esperado y el ver- 
dadero valor poblacional (EX — 1) se conoce como error muestral. En el ejem- 
plo el muestreo era aleatorio y la media muestral era sin sesgo. Todas las 
estimaciones difieren entre sí y de u; esto se debe a que cada estimación es un 
solo muestreo y cada muestra contiene diferentes estimaciones. En la práctica, la 
estimación del parámetro población sólo se basa en una muestra y se puede esti- 
mar de un muestreo aleatorio qué tan grande es la diferencia. 

Esta estimación se basa en algunos instrumentos que miden la dispersión de 
la distribución muestral, como la desviación estándar o su cuadrado, que es la 
varianza. La desviación estándar para la distribución muestral, en el ejemplo, es 


(57.5 — 57.0? + (45,0 — 57.0) + (60.0 — 57.0? + (535.0 — 57.09? + (52.5 — 57.0) + 
(67.5 — STOP + (62.5 — 57.09 + (55.0 — 57.07? + (50.0 — 57.0? + (65.0 — 57.09 


= V4,350 = 65.95 
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Se llama error estándar a la desviación estándar de una distribución muestral, y 
sirve como criterio para evaluar la probable precisión de una estimación. El error 
estándar (SE) puede ser estimado de un solo muestreo aplicando la siguiente 
fórmula: 


SE(x) = 
donde: 
o = Desviación estándar de la población. 
N = Número total de unidades poblacionales. 
n= número total de unidades muestrales. 


Se puede usar la versión modificada de la desviación estándar de la pobla- 
ción $ en lugar de o. 


entonces: 


S N a 
A 


Si la población es muy grande en comparación con la muestra, el factor 1 — (7) 
puede elimarse. Este factor es conocido como correlación finita de la población; 
si se elimina este factor, la fórmula será SE(x) = S f Va. En el ejemplo, como 
N = 5 y n = 2, no podemos eliminar dicho factor; entonces 


sg? = $005 OP? + (65.0 — 57.07 + (40.0 — 57.0" + (70.0 — 57.0P + (60.0 — STOP 
7 4 


14500 
SEG) = 2 


este resultado es igual al anterior. 
La desviación estándar de la media se basa en dos factores: el valor de n 
(tamaño de la muestra) y el valor de S o y (variabilidad en la población). 


= 14,500 
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8.11 EL TEOREMA DEL LÍMITE CENTRAL 


El torema del límite central señala que si se toma un muestreo de tamaño 10 
con el método aleatorio simple utilizando una población con media u y una 
varianza 9”, cuando el número de muestreo » es grande, el promedio muestral 
se distribuirá normalmente con promedio igual a ya, y varianza igual a on, 
mientras mayor sea el valor de n, más cerca estará la distribución de las 
medias muestrales de la distribución normal. Observe el impacto de este teo- 
rema, ya que significa que cualquier forma que tenga la curva de la población, 
la distribución de promedio muestral será normal siempre que el muestreo 
sea lo suficientemente grande. Pero, ¿qué tan grande debe ser el tamaño del 
muestreo? Si la distribución de las variables poblacionales (parámetros) es 
normal, entonces el promedio muestral de n = 1 será normalmente distri- 
buido. 

Si la distribución de los parámetros es simétrica pero no normal, entonces 
un muestreo pequeño producirá una distribución en donde el promedio muestral 
es normal. Si la distribución de las variables poblacionales es altamente sesgada 
o desviada, será necesario un muestreo grande. La distribución estadística como 
promedio muestral puede suponerse normal si se trabaja con un muestreo de 
tamaño suficiente. No se requiere suponer que la variable de población está dis- 
tribuida normalmente para que se puedan hacer inferencias aplicando la teoría de 
la curva normal. Ver la figura 8.5 

Estimación del intervalo de confianza. La finalidad de lo explicado es cono- 
cer cómo hacer inferencias acerca de la población. Se sabe que en la práctica no 
se seleccionan varios muestreos, sino que con el resultado de un solo mues- 
treo se tiene que hacer inferencia para los parámetros poblacionales. Toda esta 
técnica está relacionada con los intervalos de confianza, 


Figura 8.5, Curva de distribución normal. 
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Se Ilama intervalo de confianza al rango dentro del cual se puede localizar 
un parámetro particular de la población con cierta probabilidad previamente 
especificada. En otra parte de este capítulo se dijo que el promedio poblacional 
es igual al promedio muestral de todos los posibles muestreos que se pueden 
tomar de dicha población, y que se puede estimar la población estándar de los 
promedios muestrales. Con cualquier distribución normal cierto porcentaje de 
todas las desviaciones está dentro de cierto número de desviaciones estándar. 
Por ejemplo, 95% de los valores muestrales están dentro de + 1.96 de desviación 
estándar. Ahora bien, la distribución muestral es el promedio poblacional 1 y su 
desviación estándar está dada por los errores estándar del promedio ox = ova, 
por lo tanto, es verdad que: 


+ 68.26 por ciento del promedio muestral está dentro de + 1ax del prome- 
dio poblacional. 

» 94.45 por ciento del promedio muestral está dentro de + 2ox del prome- 
dio poblacional. 

+ 99.73 por ciento del promedio muestral está dentro de + 3ox del prome- 
dio poblacional. Ver figura 8.5. 


En general, 1 + Zox puede contener cierto porcentaje de todos los prome- 
dios muestrales dependiendo del valor elegido para Z. Esta expresión se puede 
escribir como: 

D 4-Zox=x=<su+Zox 

Es verdad que cierto porcentaje de tiempo implica que el promedio muestral 
estará en el intervalo de un cierto número de desviaciones estándar hacia el 
promedio, la desigualdad anterior se puede escribir como: 

ID x-Zor=u=x+Zox 

Si la primera ecuación estaba correcta 95% del tiempo (z = 1.96), entonces 
la segunda ecuación también estará correcta. Cuando se hace inferencia con base 
en un solo promedio muestral, se usa la segunda ecuación.? 

Ejemplo: 
Supóngase que la distribución del promedio muestral de un muestreo de tamaño 


n = 2 tiene una distribución normal y que el muestreo era AB, en donde su 


3 Se aplica la teoría bayesiana. “Las probabilidades iniciales de cada uno de los posibles valores de 
parámetro y desconocidos son iguales”. 
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promedio de variable de ingreso es 5,800 (ver tabla 8.4), El 95% de intervalo de 
confianza (Z = 1.96) usando la segunda fórmula puede ser 


5,800 — 1.96(1,587) < y = 5,800 + 1.96(1,587) 
2,689 < p< 58,911 


Otro ejemplo con otro método 


Suponga que un investigador quiere estimar la proporción de las familias en 
determinada población que tenían televisión a color en 1982, El investigador uti- 
lizó un modelo estándar de muestreo probabilístico para encontrar propietarios 
de un muestreo de 400 familias, y estimó que 35% de las familias de dicha 
población tenían televisión a color. En esta etapa, el investigador quiere calcular 
el intervalo de confianza para encontrar el número de propietarios en tal po- 
blación. El investigador quiere conocer con 95% de confianza el porcentaje de 
habitantes que tiene televisión a color. 
La fórmula básica es: 


E T(EE) o (E — T.EE) hasta (E + T.EE) 
donde: 
E Estadístico (valor muestral para estimar el valor poblacional). 
T Índice de la muestra y del valor de confianza deseado. 
EE Estimación de precisión asociado con E, se le conoce como error es- 
tándar. 


Suponga: 


E = 35 como calculó el investigador según el muestreo. 
T= 1.968. 


dado el tamaño de muestreo n = 400 y el intervalo de confianza deseado del 
95%, se tendrá 


95 (a =.05, 3 = 025, con grado de libertad n — 1,6 399) 


1(390.65)/400 = .024 


usando la fórmula S, = 
entonces: 


.34 + (1.968.024) Ó .303 hasta 3.97 
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Entonces, el investigador puede determinar con 95% de nivel de confianza 
que el porcentaje de las familias que en 1982 tenían televisión a color era entre 
30.3 y 39.7 por ciento, con una estimación singular del 35%. 

Se puede elaborar un intervalo de confianza para cualquier estadístico, 
mientras que su principal uso es hacer inferencias, también se puede aplicar para 
probar algunas hipótesis específicas. 


8.12 DETERMINAR EL TAMAÑO DEL MUESTREO 


Ya se puede determinar el tamaño del muestreo. Si el costo y otras limitaciones 
no influyen en la decisión respecto al tamaño del muestreo, no habrá problemas 
para encontrar el tamaño deseable. Se puede usar la fórmula del error estándar 


MN TN NN 
sE) 
Ignorando la correlación finita de la población tendremos: 


Ss 
EE = 5 
Donde $ es la desviación estándar de la variable en estudio, Despejando n, 
se tiene: 


s 
"SEP 


Para calcular el tamaño de la muestra n, el investigador debe tener ciertas 
ideas respecto a la desviación estándar de la población; debe decidir respecto al 
tamaño del error estándar que será aceptable. Por ejemplo, si se decide extraer 
una muestra aleatoria simple de una poblacián de 10,000 unidades, y si $? es 
igual a 20, y el error estándar deseado es EE(x) = .016, el tamaño de la muestra 


' O E 
será de n = 000256 — 781.25. 


Si el tamaño de la muestra representa una parte importante de la población, la 
correlación finita de la población será considerada en la fórmula, y en dicha 
condición el tamaño de la muestra en el ejemplo sería de: 
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El proceso de determinación del tamaño de la muestra en la práctica es más 
complejo que el de los ejemplos mencionados. Existen varias dificultades, como 
la determinación del grado de precisión del muestreo, y cómo se analizarán los da- 
tos que influyen en el tamaño de la muestra. Si el estudio tiene más de una variable, 
el tamaño determinado para una variable quizás no sea satisfactorio para las 
otras; además, si se usan las fórmulas mencionadas se requiere una estimación 
de la desviación estándar, 


Otra fórmula para determinar el tamaño del muestreo 


La fórmula que se indica a continuación es la más elemental y la que más se uti- 
liza para determinar el tamaño del muestreo cuando se quiere investigar un solo 
parámetro: 

PR 


di 


tamaño del muestreo. 

valor £ al cuadrado correspondiente a un nivel de confianza seleccio- 
nado por el investigador. 

o? = varianza del parámetro poblacional que se desea estimar. 

d? = error permisible al cuadrado en la estimación del parámetro. 


Ejemplo: 


Supóngase que un investigador quiere determinar la proporción de las familias 
en ciertas colonias que tienen perro. Según las autoridades, una de cada cinco fa- 
milias tiene perro, pero el investigador piensa que es necesario tomar un mues- 
treo. Como proceso de muestreo se debe determinar el tamaño de la muestra. Si 
el investigador quiere emplear un coeficiente de confianza de .90 y quiere cer- 
ciorarse de que la estimación de muestreo estará entre + 4 por ciento de la pro- 
porción poblacional, según el proceso de investigación el tamaño de muestreo 
sería (aplicando el muestreo aleatorio simple): 


2 = 2,72 (como 1 — 


= 90,0: =.10 y af2 =.05) 


según la tabla de distribución de £ 


1165. 
.16 (como P = .20 y .20 (.80) es la estimación de la varianza). 
0016 o sea (.04)?. 


204 MUESTREO 


entonces an = (2.72 X .16N.016 = 272. 
El investigador usará una muestra de 272 unidades poblacionales. 


3.13 TAMAÑO DEL MUESTREO CUANDO SE TRABAJA 
CON ATRIBUTOS 


Ya se trató el tamaño del muestreo para las variables en términos de la media 
aritmética y del error estándar, Suponga que un problema por estudiar está rela- 
cionado con el porcentaje (datos de atributos); por ejemplo, una empresa desea 
crear un club deportivo familiar y cobrar 75 pesos mensuales a sus empleados. 
La pregunta es ¿qué porcentaje de los empleados aceptarán pagar 75 pesos men- 
suales? La respuesta a esta pregunta es importante para decidir si se crea o no el 
club y qué servicios se deben ofrecer. 

Para poder responder a esta pregunta, se tiene que tomar un muestreo de los 
empleados y efectuar las encuestas. Con datos de variables el interés se centra 
en la media aritmética x mientras que con atributos, el interés se centra en P 
(porcentaje de la población que tiene determinado atributo). Cuando los datos 
implican variables, se mide la varianza de la población con el cuadrado de la 
desviación estándar a”, mientras que con atributos, se mide la varianza en térmi- 
nos de PX q, en donde q es la proporción de la población en estudio que no 
tiene tales atributos (q = 1 — p). La medida de dispersión de los estadísticos 
muestra también el cambio del error estándar de la media (ax) y el error estándar 
de proporción (op). La comparación de las relaciones es: 


Datos de variable Datos de atributo 


e 
Varianza di=— ep= E 
n n 
> 0 fe 
Error estándar => op m 


El tamaño de muestreo para los datos de atributos se puede calcular si se 
toma una decisión objetiva respecto a la estimación del intervalo aceptable y el 
grado de confianza. Supóngase que un sondeo (etapa exploratoria) indicó que 
30% de los empleados aceptaron pagar la cuota y también que se desea estimar la 
verdadera proporción de la población con un rango del 10% (p = 0.30 + 0.10). Si 
se desea estar 95% seguros de que el parámetro poblacional está dentro (+ 0.10) 
de la población muestral, entonces el tamaño de muestreo se calcula de la si- 
guiente manera: 


sl PE UN EA 
Pao 0051 = 


n= 82 
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En donde: 


20.10 = rango de intervalo deseado. 
1960p = 0.95, nivel de confianza para estimar el rango de intervalo 
aceptable de la proporción de la población. 
op = 0.051 = error estándar de la proporción; se puede calcular me- 
diante (0.10/1.96). 
Pq = medida de la dispersión muestral. 


Por ejemplo: el tamaño del muestreo se obtuvo considerando la varianza 
que resulta del sondeo. Supóngase que no se realiza el sondeo; entonces no se 
tiene la varianza. En este caso se utiliza la lógica en que la razón pg nunca puede 
exceder 0.25. Si p = 0.5, entonces q será también 0.5 y su producto 0,25, Si p o 
q son mayores que 0.5, entonces su producto, p X q, será menor que 0.25; (por 
ejemplo, 0.3 X 0.7 = 0.21). 

Cuando no se tiene información respecto a p, se puede suponer que p = 0.5 
y calcular el tamaño de la muestra. Entonces 


op= Pl =0051= (9505, 
a-1 n-1 


n=97 


La interpretación de los datos obtenidos de un muestreo de tamaño 97 selec- 
cionado al azar de la población de los empleados de dicha empresa sería: si se 
encuentra que 50% de los empleados aceptarán la cuota del club familiar con un 
costo de 75 pesos mensuales; entonces se puede deducir, con un nivel de con- 
fianza del 95%, que en un censo, de un 40 a un 60% de los empleados de la em- 
presa aceptarían. 


8.14 TÉCNICAS DE MUESTREO PROBABILÍSTICO 


Como se definió anteriormente, en las técnicas de muestreo probabilístico, todos 
los elementos poblacionales tienen igual oportunidad de extraerse. 


8.14.1 Muestreo aleatorio simple 


Es una técnica de muestreo que selecciona elementos poblacionales de manera 
tal que cada combinación de los elementos poblacionales de un muestreo de ta- 
maño » tiene la misma oportunidad de seleccionarse. Este muestreo puede ser 
con reemplazo o sin reemplazo, pero como en los estudios del área de contaduría 
o administración utilizan muestreo sin reemplazo con mayor frecuencia, todas 
las técnicas de muestreo probabilístico que se mencionan en esta obra serán téc- 
nicas sin reemplazo. 
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Para aplicar el muestreo aleatorio simple a una población en estudio se 
deben seguir tres etapas: 


1. Identificar cada elemento poblacional. Esto significa asignar un número 
secuencial a cada elemento de forma tal que cada uno reciba diferentes 
números, desde 1 hasta N; donde N es igual al tamaño de la población. 
No siempre es necesario asignar un número a los elementos poblacio- 
nales, porque si la población son los empleados se puede utilizar el 
número de su carnet de identificación, o si la población en estudio son 
todos los clientes de un banco o de una tienda, se pueden usar sus nú- 
meros de cuenta. En general, cuando la población en estudio tiene algún 
número de identificación, éstos pueden usarse; sin embargo, el inves- 
tigador deberá conocer el número mínimo y máximo y su rango para 
cerciorarse de que no haya brechas entre los números, y si las hubiere, 
conocerlas, 

2. Seleccionar aleatoriamente los elementos con una probabilidad equitati- 
va. Cada selección aleatoria debe ocurrir en forma independiente de 
cualquier otra. Cada selección aleatoria debe ocurrir con la misma proba- 
bilidad. Para lograr estos objetivos el investigador debe elegir un proce- 
dimiento que le asegure tal fin. Los números se pueden meter en una caja 
y elegirlos al azar; se pueden usar monedas o dados, pero el mejor méto- 
do es usar la tabla de números aleatorios (tabla 1 en el apéndice). Los 
números en la tabla 1 se obtuvieron de tal manera que cada dígito se se- 
leccionó independientemente. Para usar los números aleatorios de la ta- 
bla se tiene que entrar aleatoriamente en la tabla y después seleccionar 
sistemáticamente los números moviéndose en columnas o renglones. 

3. Se seleccionan los elementos de la población con probabilidad igualitaria 
usando un procedimiento como la tabla de números aleatorios. 


Ejemplo: 


Una empresa farmacéutica quiere realizar con sus visitadores médicos un experi- 
mento con el cual desea saber el resultado de un curso de capacitación en las 
cualidades y eficiencia de los vendedores. Desea tomar un muestreo aleatorio 
de tamaño 15. La empresa tiene 616 vendedores, los cuales tienen un número de 
identificación que empieza con 7 y tres dígitos del 001 al 616. Como el 7 es la 
identificación del puesto se ignora y sólo se basa uno en los tres dígitos del 1 al 
616. Se ha verificado que en los números como empleado no existe brecha, y 
que los números son secuenciales del 001 al 616, Se usa la tabla de números 
aleatorios (tabla 1 del apéndice). Con los ojos cerrados se pone un dedo aleato- 
riamente sobre un número, se seleccionan dos dígitos de izquierda a derecha; 
suponga que son 7 y 3. Se empezará a usar el número del renglón 7 y la columna 
3. Este número es el 346 334, 
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Como todos los números de identificación de los empleados son de tres 
dígitos, de los números aleatorios se escogen los tres dígitos de izquierda a dere- 
cha; suponga que se decide usar los tres números a la derecha de cada número 
aleatorio, los números se leen así: 


346 338 701 473 75305 
59 013 394 268 3844 044 
487 466 601 249 820 814* 
223 000* 991 617* 892 018 
487 550 719 335 

71431 572336 
131 064 580 072 


* Fuera de rango 


Por tanto, se seleccionan 15.empleados. Si se repite el número, se ignora. Si 
tales números son más grandes o pequeños que el número de empleados, se con- 
sidera el número como fuera de rango y se ignora. 

El muestreo aleatorio simple necesita tres elementos: la lista de las enti- 
dades poblacionales, el conocimiento de sus números de identificación o asig- 
narle números a ellos, y algún procedimiento de selección aleatoria. No obstante 
que esta técnica de muestreo es tan simple, no se usa muy frecuentemente por 
varias razones: 


1. No siempre es posible conseguir la lista de entidades poblacionales y, 
por tanto, un número de identificación de ellas; por ejemplo: suponga 
que una compañía automotriz quiere saber la opinión de los adolescentes 
residentes en Mexico, D.F. respecto a su nuevo auto. Desea tomar un 
muestreo de 1,500 adolescentes. Sólo un censo especial puede propor- 
cionar un marco muestral que permita conocer las entidades pobla- 
cionales para aplicar la técnica de muestreo aleatorio. 

2, Otra razón es el grado de representatividad de un muestreo que busca el 
investigador. Tal muestreo debe tener: 


a) Marca muestral que corresponda a las poblaciones, 
b) Un procedimiento de muestreo que genere pocos errores muestrales. 
e) Un tamaño de muestreo que genere pocos errores muestrales.* 


3. El muestreo aleatorio siempre es más caro que las otras técnicas de 
muestreo probabilístico. 


Error muestral es la diferencia entre el resultado del muestreo y el censo. El investigador estima el 
error muestral de la media aplicando la teoría del intervalo de confianza con la fórmula: 


Z sx o 1 sx con | — ar grado de confianza. 
Zo psx + Zsx), 
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8.142 Muestreo estratificado 


Es una técnica de muestreo probabilístico en la que se divide la población en 
estudio con base en alguna(s) variable(s) en diferentes grupos o clases y después 
se toma el muestreo de cada grupo. 

La población en estudio se segmenta para tomar el muestreo debido a tres 
razones: 


a) Aumentar el grado de precisión muestral y de eficiencia. 
b) Proporcionar datos adecuados para analizar varios segmentos. 
c) Permitir aplicar diferentes procedimientos. 


Estadística para diferentes segmentos 
Como su nombre lo indica, la aplicación de esta técnica requiere de dos etapas: 


1. Dividir la población en estudio en grupos mutuamente excluyentes y 
exhaustivos. Esto indica que se debe asignar cada elemento poblacional a 
un solo grupo, y que ningún elemento poblacional debe quedar elimi- 
nado. 

2, Después de estratificar la población, aplicar el muestreo aleatorio simple 
para tomar el muestreo en cada grupo. 


La idea principal del muestreo estratificado es incrementar el grado de 
precisión muestral, o al menos controlar las variables extrañas que pudieran au- 
mentar el error muestral. Esta variable será la base de estratificación. Es muy 
importante identificar la o las variables de la base de la estratificación. Si no 
existe información para identificar las variables, se puede aplicar un estudio 
piloto o exploratorio para conocer las variables de estratificación. Dice W. G. 
Cochran que un número de variables de estratificación mayor que seis genera 
problemas de confusión y precisión muestral. 5 

Ejemplos de variables de estratificación pueden ser: sexo, tasa de consumo, 
edad, tamaño de la empresa, capacidad de producción, etcétera. 

En general, la eficiencia del muestreo estratificado depende de que los gru- 
pos o estratos sean lo más homogéneos posible y de que los diferentes grupos 
sean lo más heterogéneos posible. 

El muestreo estratificado proporcional o el muestreo estratificado despro- 
porcional se pueden aplicar dependiendo de los objetivos del estudio. 


3 W. G. Cochran, Sampling Techniques, 2a. ed., New York, John Wiley $: Sons, Inc., 1963, p, 134. 
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Muestreo estratificado 


Suponiendo que de cada estrato se tomaron diferentes muestreos, la medida y la 
desviación estándar de la variable de la población en estudio puede estimarse de 
la siguiente manera: 


En donde: 


Tamaño del estrato ¿ 

Tamaño de la muestra en el estrato ¿ 

= Tamaño de la población bajo estudio 
n= Tamaño total del muestreo MN 

W, = Peso estimado del estrato ¡ = 
K Número del estrato y 
S; = Desviación estándar del estrato ¿ 
X <= Media del estrato ¿ 


$.14.3 Muestreo estratificado proporcional 


Para este muestreo, el tamaño de cada estrato (ni) está dado por la proporción de la 


Ni; 
población en cada estrato > Entonces, la desviación estándar estimada sería: 


2 s2 


En 2 /N, 
SX= (25) DÍ 


Ni 
ycomorn¡= ÁÚ=n, 
N 
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Tabla 8.6. Ejemplo de muestreo estratificado proporcional. 


Tamaño del Tamaño de muestreo Promedio de crédito Desviación 

estrato en cada estrato PE otorgado en millones 

1 8000 80 20 4 

2 6000 60 10 4 

3 4000 40 15 5 

4 2000 20 06 2 
20000 200 

Ejemplo; 


Supóngase que una empresa automotriz tiene interés en efectuar un estudio 
sobre su política de crédito. Dicha compañía tiene 20,000 distribuidoras en Mé- 
xico y quiere tomar un muestreo de 200 (n = 200) para estudiar este fenómeno. 
Suponga que el investigador de esta empresa tiene conocimientos previos y 
sabe que existe una relación entre la política de crédito y el volumen de ventas; 
además, tiene una lista de dichos volúmenes de venta de los distribuidores y que 
según ésta, los divide en cuatro grupos: muy grande, grande, mediano y pe- 
queño, y que el número de distribuidores en cada estrato es de 8000, 6000, 4000, 
y 2000 respectivamente (ver tabla 8.6). Se aplicará un muestreo proporcional, 
con un tamaño de muestreo en cada estrato proporcional al tamaño de la mues- 


tra, O Sea: 
Ni 
m= (y) xn 


Debido a que se desea tomar un muestreo proporcional de 200, cada estrato 
representará 80, 60, 40, y 20 miembros en el muestreo. 

Suponga que ya se tomó un muestreo de 200 y el resultado se indica en la 
tabla 8.6. Entonces la estimación del promedio del crédito que otorgaron a los 
clientes sería: 


promedio X= .4(20) + .3(10) + 2(15) + .1(6) +8 +3 +.6= 14,6 


X= p(£ pe O Es 
X= (4) (55) + (6) + ls) (1) (20) 


= V(032 + .024 + .025 + .002) = V.083 = 288 
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8.14,4 Muestreo estratificado desproporcional 


El muestreo estratificado proporcional está tan desviado que cada elemento de 
la población tiene la misma oportunidad de ser elegido. En el muestreo despro- 
porcional no es así, porque algunos estratos reciben más atención que otros y 
forman mayor parte en el muestreo que las de los otros estratos. 

Hay varias razones para utilizar el muestreo desproporcional: puede ser 
cierto que algún estrato sea muy importante para la toma de decisión gerencial, y 
por esto el investigador quiere que un número considerable del muestreo sea de 
este estrato, 

Quizás el investigador quiera comparar dos diferentes estratos, pero el ta- 
maño del muestreo que resulta de uno de estos dos estratos sea tan pequeño que 
la comparación resultará sin significación. 

En nuestro ejemplo, comparando los estratos más grandes (el 1), y más 
pequeño (el 4) cuyo tamaño muestral es 801/20 respectivamente, no proporciona 
suficiente información por la diferencia que hay en el tamaño del muestreo, por 
lo que se debe aplicar un muestreo estratificado desproporcional si interesa estu- 
diar sólo los dos mencionados grupos de la empresa, 

El muestreo estratificado desproporcional también se utiliza por motivos de 
costo, porque puede ocurrir que el costo de muestreo de distintos estratos sea 
diferente, y el presupuesto fijo asignado para este fin permita ajustarlo, seleccio- 
nando una muestra más grande de aquellos estratos que resulten más baratos, 


+ Para aumentar la eficiencia neta de un muestreo,ó 

+ El muestreo desproporcional se usa por razones estadísticas. Si el obje- 
tivo es un estimador más confiable, entonces el tamaño óptimo del 
muestreo extraído de cada estrato depende de su tamaño y de la varian- 
za dentro de los estratos. Como ejemplo se puede decir que un estrato 
tiene un promedio de crédito otorgado de 20 000 con una desviación es- 
tándar de 3 y otro estrato con un promedio de 320 con una desviación 
estándar igual a cero (ejemplo de empresa automotriz). 


La fórmula general para obtener el muestreo óptimo y minimizar la varianza 
total de la estimación es: 


Mi 


y el error estándar de la media es: 


$ La eficiencia neta muestral se mide con base en la precisión y el costo. 
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8.14.5 Muestreo sistemático 


Es una técnica de muestreo probabilístico en la que se seleccionan las unidades 
de estudio después de seleccionar la primera unidad del estudio. Se necesitan 
cuatro etapas para aplicar esta técnica de muestreo: 


1. Listar las unidades de estudio en el marco muestral, asignándole mú- 
meros del 1 al N. 


2. Encontrar el intervalo muestral, el cual se obtiene dividiendo el tamaño 
N 
de la población entre el tamaño de la muestra deseado, entonces K = pá 


3. Escoger en forma aleatoria a partir del número | hasta el k, el primer nú- 
mero F. 
4, Elegir los elementos subsecuentes a intervalos dados (XK). 


Entonces, la primera unidad poblacional que fue muestreada es r, la segun- 
da sería (r + k), la tercera (r + 2£) y la última [r + (1 — DK]. 


Ejemplo: 


Suponga que un subdirector de Pemex desea saber el nivel de conocimientos de 
sus ingenieros que ocupan gerencias, respecto a los problemas políticos mun- 
diales causados por el petróleo. Suponga que Pemex tiene 5 000 empleados con 
grado de ingeniero en diferentes niveles, y que decide tomar una muestra de 500 
y les pide contestar un cuestionario. Para aplicar el muestreo sistemático se de- 
berían realizar los pasos siguientes: 


1. Listar a los 5 000 ingenieros, asignándoles un número del 1 al 5 000, 


N 5000 
2. Encontrar el intervalor muestral K = “7, =“5pg 5K= 10. 


n 
3. Elegir aleatoriamente un ingeniero entre el 1 y el 10. Supóngase que eli- 
gió el 6. 
4. Seleccionar los ingenieros con números 16, 26, 36, 46, 56, ... 4996. 


El muestreo sistemático es más fácil que el aleatorio simple porque no tiene 
el problema de la duplicidad, ni la necesidad de una tabla de números aleatorios 
en todo el proceso de muestreo. Este tipo de muestreo puede ser más representa- 
tivo, y se puede obtener mayor precisión que con el muestreo aleatorio simple, 

El grado de precisión del muestreo sistemático depende de como se listan 
las unidades poblacionales. La lista puede ser aleatoria, monotónica o cíclica. Lis- 
tar las unidades poblacionales aleatoriamente es como preparar las listas de los 
empleados, la de los miembros de una asociación o la de los clientes en orden 
alfabético. 
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Listar monotónicamente se refiere a elaborar una lista de las unidades po- 
blacionales de mayor a menor; de grande a pequeño. Por ejemplo, preparar la 
lista de los distribuidores o de clientes según el volumen de sus ventas o com- 
pras; o en el ejemplo de los ingenieros de Pemex, ordenarlos con base en los 
años de experiencia. En otro ejemplo, listar los distribuidores de una armadora 
de autos según la cantidad de créditos otorgados. Respecto a los clientes de un 
banco, sería listarlos según el monto en sus cuentas. 

Este método para elaborar el cuadro muestral (lista de las entidades pobla- 
cionales) ofrece una mayor precisión en la muestra sistemática, ya que no hay 
riesgo de que sólo los mayores o menores se seleccionen. 

Elaborar la lista de las entidades poblacionales considerando los fenómenos 
cíclicos evita caer en pasos cíclicos. Por ejemplo, suponga que se desea analizar 
las ventas de Aeroméxico con base en la duración del viaje. Se conocen las ventas 
actuales de Aeroméxico. Analizar la venta de 365 días puede ser muy costoso y, 
además, el presupuesto asignado no lo permite. Suponiendo que el presupuesto 
permite analizar la venta de 52 días, un día de cada semana: si no se consideran 
fenómenos cíclicos, un muestreo sistemático que analiza todas las ventas de los 
domingos, lunes a viernes (K = 365 + 52 = 7), sería sesgado. 


8.14.6 Muestreo por grupos 


Es una técnica de muestreo probabilístico en el cual se divide la población en 
grupos y después se seleccionan aleatoriamente para su estudio. 

Para que el lector no confunda el muestreo de grupos con el muestreo estra- 
tificado, se explicará la diferencia de estas dos técnicas de muestreo. 

En el muestreo estratificado, la población se divide en pocos grupos (máxi- 
mo seis) con muchos elementos poblacionales; en cambio, en el muestreo por 
grupos, la población se divide en numerosos grupos con pocos elementos pobla- 
cionales. La segmentación en el primero es con base en una variable; en el se- 
gundo es por la conveniencia o la consideración del costo. 

En el muestreo estratificado, los grupos son homogéneos pero heterogéneos 
en comparación con otros grupos. 

En el muestreo estratificado aleatoriamente, los elementos de cada grupo se 
seleccionan, mientras que en el muestreo por grupos se seleccionan aleatoria- 
mente y después se estudian los miembros de los grupos seleccionados. 

Por lo general, el muestreo por grupos se aplica cuando no se tiene un mar- 
co muestral adecuado y cuando se busca realizar un estudio que sea económica- 
mente eficiente. 

EJ muestreo por grupos tiene poca eficiencia estadística en comparación con 
otras técnicas de muestreo probabilístico, principalmente porque los grupos tien- 
den a su homogeneidad, o sea que en varios grupos pueden estar individuos con 
el mismo estrato social, nivel económico, empleo, etcétera. Mientras que la efi- 
ciencia estadística puede ser mas baja, a menudo la eficiencia económica es su- 
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ficientemente grande para compensar esa “debilidad”, lo que indica que existe 
un balance de eficiencia neta. 

Para disminuir el error muestral en esta técnica, se puede incrementar el 
número de grupos y esto permite tener un mayor número de selecciones mues- 
trales. Para entender estas aclaraciones, se van a dar a conocer los conceptos 
estadísticos del muestreo por grupo: 


ñ 
2%; 
E 


Media del grupo X; = m 


+ Media muestral X GR = 


S (X, - XGR? 
É 


+ Varianza muestral S7GR = An 


5 2 a 
+ Error estándar estimado SXGR = [ Ez ( - 2) 


A 
donde: 
a = número de grupos seleccionados en el muestreo. 
A = número de grupos en la población. 
b = número de elementos poblacionales seleccionados en cada grupo. 
Ejemplo: 


Suponga que se seleccionan dos grupos con 8 elementos poblacionales cada uno 
en una población grande, y que sus medias en la variable de interés son las si- 
guientes: 
XGR 
GRUPO 1 3 6 5 8 9 2 6 7 6 
GRUPO2 12 14 13 11 17 12 15 18 14 


a (6+ 14) _ 
=£t+2 10 
harta 


u 


Tendrá XGR- 


—10? an ? 
sGR = 6 20 ¿04 0 =n 
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El error estándar estimado es: 


SXGR-= 


SGR JS 
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[2 


ma 
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Ahora, suponga los mismos miembros muestrales pero haciendo dobles los 
números de selecciones independientes, o sea, los mismos números muestrales 
se dividen en cuatro grupos: 


GRUPO 1 
GRUPO 2 
GRUPO 3 
GRUPO 4 


Se tendrá: 


XGR = (60 + 6.0 + 12.5 + 15.5 /4 = 10 


XGR 


SGR = 


SXGR = ( 


(6 — 10)? +(6 — 10? +(12.5 — 109 +(15.5 — 109 _, 


y 


2.8 


Como se puede ver, el número de grupos se incrementa y disminuye el error 


estándar. 


Hay que notar que existe poca variabilidad entre los grupos, y las medias 
tienen valores muy parecidos o son similares. Por lo general esto ocurre cuando 
la misma edad, ingreso, ocupación, etcétera, aparecen en varios grupos. Esta si- 
tuación presenta un error estándar mas grande y es por eso que el muestreo por 
grupos es menos preciso, 

Para visualizar esta situación se modificará el ejemplo y se calcularán los 
estimadores para ver la diferencia. Suponga una diferencia en la cuarta columna 


de cada grupo: 


GRUPO 1 
GRUPO 2 
GRUPO 3 
GRUPO 4 


13 
11 


XGR 
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Se tendrá: 
XGR = (8.25 + 7.25 + 13.5 + 11.0 /4=10 


(8.25 — 10)? +(7.25 — 10? +(13.5 — 10? +(11 — 109 =1 


S'GR = 
3 


.96 


= 7.962 
sar = (25) =14 


Por lo tanto, se ve cómo el error muestral en esta técnica también depende 
de la variabilidad dentro de los grupos. Entre mas variabilidad, menor será el 
error. 


8.14,7 Muestreo por área 


Es una típica de muestreo por grupo. Muchas investigaciones indican que las 
poblaciones se pueden identificar como áreas geográficas. El método “por área” 
se ha aplicado a poblaciones nacionales o regionales que tienen características 
físicas, políticas o naturales similares, 


8.14.8 Muestreo doble 


Es el procedimiento para recopilar información por muestreo y luego usarla como 
base para seleccionar una submuestra para un estudio posterior, Usualmente se 
encuentra en conjunto con los diseños estratificados o de racimos. 


8.15 EL USO DEL MUESTREO PROBABILÍSTICO 


Técnicamente, la discusión sobre si usar el muestreo probabilístico o el no pro- 
babilístico favorece al primero. Los diseños del segundo tipo tienen siempre la 
posibilidad de que algunos elementos inducidos del muestreo distorsionen los 
resultados; además, con el muestreo no probabilístico no se puede estimar un 
rango de intervalo del cual esperar el parámetro de la población; hay, sin embar- 
go, varias razones por las cuales se usa. 


8.16 CONDICIONES DE USO 


Este tipo de muestreo se puede usar cuando no existe otra alternativa: por ejem- 
plo, porque la población total no está disponible para el estudio. Si bien el 
muestreo probabilístico puede ser superior en teoría, hay posibles fallas en su 
aplicación, derivadas en general por incapacidad de los practicantes. 
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Una muestra aleatoria que es una sección cruzada de la población puede no 
ser el objetivo de la investigación. 

Finalmente, los costos y el tiempo requeridos por el muestreo probabilístico 
pueden ser tan grandes que el investigador prefiera abandonar este tipo de mé- 
todo. 

Si se controla cuidadosamente el muestreo probabilístico, puede ofrecer re- 
sultados aceptables, aunque no pueda escaparse de sus deficiencias estadísticas. 


CAPÍTULO 


9 


Medición y escalas 


9.1 INTRODUCCIÓN 


Después de definir el problema, determinar las variables y expresar las hipótesis, 
éstas deben probarse; para ello se necesita medir si existen ciertas condiciones. 
Si existen éstas en la vida real y están expresadas por hipótesis, se aprueban; y si 
no existen, se les rechaza. La medición es el proceso mediznte el cual se prueban 
las hipótesis y las teorías. 

En este capítulo se explica la medición, sus niveles, validez y confiabilidad; 
y se explica brevemente el desarrollo de las escalas de medición. 


9,2 QUÉ ES LA MEDICIÓN 


Según S. Stevens “La medición consiste en asignar numerales, números y otros 
símbolos a propiedades empíricas (objetos, cuentas o variables) conforme a cier- 
tas reglas. 

Se pueden medir objetos tales como mesas, gente, libros o automóviles; o 
bien, cosas que no son concretas como: preferencias, actitudes o neutrones. 

También se miden las propiedades; es decir, las características de un ser 
humano: peso, estatura, posición económica, etcétera; sus propiedades psicoló- 
gicas: actitudes, inteligencia, etcétera. Se puede decir en un sentido más liberal 
que en la investigación no se miden las propiedades, sino indicadores de ellas. 

En la definición de Stevens hay tres elementos que se deben explicar: 
numerales, asignación y reglas. 

Los numerales son símbolos como l, II, III; ó a, $, y ó A), B), C); un nume- 
ral no tiene significado cuantitativo a menos que se le asigne; los numerales se 
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pueden usar para etiquetar objetos o personas; jugadores de futbol, placas de 
automóvil, o unidades muestrales de una población. Cuando se les da significado 
cuantitativo a los numerales, se convierten en números; esto permite la posibili- 
dad de aplicar modelos matemáticos y estadísticos para describir, explicar y pre- 
decir. 

En la definición, el término asignación significa mapeo. En la figura 9.1 se 
ilustra la idea del mapeo. Allí hay círculos y triángulos en dos lados y dos 
números en el medio, Se asigna el número 1 para los círculos y el número 2 para 
los triángulos. 


Figura 9.1. 


El tercer concepto de medición es la regla. Una regla explica la forma en 
la que los numerales o números se van a asignar a los objetos o eventos. Por 
ejemplo, una regla puede ser asignar numerales del 1 al 5 a directores de dife- 
rentes departamentos de una empresa según su productividad. Suponga que se 
mide la productividad con base en el uso de información en la toma de deci- 
siones. Si un director siempre toma decisiones con base en la información, 
evaluando todas las alternativas y actuando en función de éstas, se le asigna el 
número 5, mientras que a otro director, que toma decisiones importantes rápi- 
damente, sin evaluar data y basándose en su intuición, se le asigna el número 1. 
Para casos intermedios crecientes entre estos dos extremos se asignan los 
números 2, 3 y 4 (ver figura 9.2) 

La medición consiste en asignar números o numerales a los objetos, cuentas 
o variables según las reglas. Las reglas son los componentes más significativos 
de la medición. 
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Muy productivo 
Usualmente productivo 
Semiproductivo 

Poco productivo 

No productivo 


— 04d 


Figura 9.2. 


La medición consiste en asignar números o numerales a los objetos, cuentas 
o variables según las reglas. Las reglas son los componentes más significativos 
de la medición. La medición no tendrá sentido cuando no concuerde con la reali- 
dad. Un ejemplo sería la asignación del número uno a un individuo si es mas- 
culino, y del cero si es femenino; pero es necesario un conjunto de reglas que 
definan masculinidad y feminidad. También se puede aplicar la regla de corres- 
pondencia; es decir, la regla matemática por medio de la función ().! 

Otra regla, puede ser asignar los números del O al 4 a ciertos individuos, 
según su simpatía: si uno de ellos es extraordinariamente simpático, se le asigna 
el número 4; si un individuo no lo es en absoluto, se le asigna el O, A los que se 
encuentren entre ambos límites se les asignan números intermedios. 

Se puede obtener una medición significativa si el proceso de medición tiene 
una correspondencia empírica con la realidad. Suponga que alguien está midien- 
do el grado de dureza de tres objetos: si el objeto A puede rayar al objeto B, y no 
al contrario, entonces se dice que el objeto A es más duro que el objeto B. Estas 
son proposiciones observables, y los números que muestran el grado de dureza 
se pueden asignar después de efectuar ciertas pruebas de rayado. En este caso 
tanto el procedimiento de medición como el sistema de números son isomórficos 
con la realidad. 

Isomorfismo consiste en similitud o identidad en la estructura. En la 
medición, una pregunta crítica es: ¿Es la estructura del sistema numérico similar 
O no a la de los objetos o eventos que se han medido? En algunas ramas de la 
ciencia el isomorfismo es secundario, como por ejemplo en la ciencia física, 
donde la relación de objetos en observación y el número asignado a las observa- 
ciones es casi directo; pero en las ciencias sociales y en la administración se 
debe estar alerta del hecho para que el investigador pueda hacer ciertas opera- 
ciones con los números asignados a las observaciones. 

La estructura de este método de mapeo de números a las observaciones debe 
ser isomórfica a alguna estructura numérica que incluya tales operaciones? Si 
dos sistemas son isomórficos, sus estructuras son similares en cuanto a las rela- 


'Se puede definir una función como la regla de asignar los objetos de un conjunto, a los de otro. 
*Sidney Siegel, Nonparameiric Statistics for the behavioral sciences -McGraw-Hill, Nueva York, 
1965. p. 22. 
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ciones y operaciones que dichos sistemas permiten realizar. Entonces, si un 
investigador asigna números a los objetos y después manipula esos números; por 
ejemplo, sumando, obteniendo la media, etcétera, está implicando que la estructura 
de medición es isomórfica a la estructura numérica conocida como aritmética. 


9.3 ELES DE MEDICIÓN 


Los requerimientos de isomorfismo (similaridad o identidad de estructura entre 
los sistemas numéricos y sus propiedades empíricas o indicadores de pro- 
piedades), conducen a una distinción entre las diferentes formas de medición, es 
decir, a distintos niveles de medición. A veces se usa el término de escalas de 
medición en lugar de nivel de medición. Una escala se puede definir como un 
instrumento de medición; un velocímetro es una escala, como lo es una regla o 
un termómetro. 

Las operaciones matemáticas y estadísticas aplicables a una serie de 
números dados dependen del nivel de medición. Para entender la escala se nece- 
sita conocer ciertos conceptos que a continuación se explican. 

Por lo general, hay dos tipos básicos de datos: cualitativos (no métricos) y 
cuantitativos (métricos). Datos no métricos son: atributos, características y pro- 
piedades categóricas que se pueden usar para identificar y describir a un sujeto. 
Los datos métricos sirven para medir o identificar las posibles diferencias del 
sujeto, en cantidad y grado, Las variables medidas métricamente reflejan la can- 
tidad o distancia relativa, mientras que las variables medidas con escalas no 
métricas no reflejan la cantidad o distancia relativa. Como se indica en la figura 
9.3 los datos no métricos se miden con escalas o niveles de medición nominal y 
ordinal, y los datos métricos se miden con escala intervalar o racional. 


No múltricos 
o cualitativos 


Escala Escala 
normal intervalo 


Figura 9.3. 


Míñtricos 0 
cuantitativos 


Escala 
racional 
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9,4 ESCALA NOMINAL 


La medición con la escala nominal implica asignar números u otros símbolos 
para clasificar objetos u observaciones. La escala nominal es un nivel mínimo de 
medición, porque los datos que contiene son solamente números de ocurrencia 
en cada clase o cada categoría de la variable sujeto de estudio; por lo tanto, los 
números o signos asociados a los objetos no tienen significancia cuantitativa y 
son sólo indicaciones de presencia o ausencia de algunos atributos y característi- 
cas en estudio. Por ejemplo, con los numerales 1 y 2 se puede clasificar una 
población de estudiantes y no estudiantes; o usuarios y no usuarios, o de mas- 
culino y femenino. Con otros numerales, como 6, 7, y 8, se puede clasificar una 
población como cristiana, musulmana o judía. Según las reglas, cuando una serie 
de objetos pueden clasificarse como exhaustivos (incluyen todos los objetos) y mu- 
fuamente excluyentes (ningún caso puede estar en más de una categoría) y cuan- 
do se presentan símbolos a las categorías, entonces se ha creado una escala de 
medición nominal. 

Matemáticamente, la característica básica de la escala nominal de medición 
es que las propiedades de los objetos de una categoría son iguales a los de las 
otras. Las propiedades lógicas de equivalencia son: reflectividad, simetría y tran- 
sitividad. Reflexibidad significa que cada objeto en una de las categorías es 
igual a sí mismo; a = a. La simetría está definida como la relación existente 
entre dos variables, por ejemplo, si a=6b, b=a. Transitividad significa que si 
a=b, yb=c, entonces a =c. Estas tres propiedades lógicas son operables 
dentro de los objetos en la misma categoría, pero no necesariamente entre cate- 
gorías. Por ejemplo, estas clasificaciones pueden aplicarse a todas las personas 
que se clasifican como cristianos, pero no entre cristianos y musulmanes, 

Como la única cuantificación en este nivel de medición es contar el número 
de casos en cada categoría, se está restringiendo usar la moda como medida de 
tendencia central. Sólo se puede llegar a la conclusión de cuál de las clases tiene 
más miembros y nada más, No hay técnicas de uso general para medir la disper- 
sión en la escala nominal. Se pueden usar varias pruebas de significancia 
estadística, pero la más común es la de ji cuadrado (x)?. Se puede usar el coefí- 
ciente de contingencia para medición de la correlación. 

Aunque la escala nominal es el nivel más "débil" de medición, es bastante 
útil. Si no se puede usar cualquier otra escala, casi siempre se puede crear una 
escala nominal con el mapeo antes explicado. Esta escala es valiosa, especial- 
mente en los estudios exploratorios, donde el objetivo es hallar relaciones y no 
asegurar mediciones precisas. Esta escala también se usa muy frecuentemente en 
encuestas y otros estudios ex-post-facto, donde los datos se han clasificado en las 
principales categorías de la población. 


9.5 ESCALAS ORDINALES 


Estas escalas tienen las características de las escalas nominales además de un 
indicador de orden. La medición ordinal es posible cuando el postulado de tran- 
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sitividad se justifica. Este postulado establece que si a es mayor que b, y b es 
mayor que c, entonces a es mayor que c. El uso de una escala ordinal implica 
utilizar los operadores mayor que, igual a, y menor que, pero sin poder indicar 
su orden de magnitud. 

En este nivel de medición no sólo se clasifica, sino también se exhibe una 
forma de relación. La relación mayor que (>) es irreflexible, asimétrica y tran- 
sitiva. La irreflexibidad es una propiedad lógica de si es o no verdad. Dice 
que a = a. Asimétrica significa que si a > b, entonces b <a. Transitiva quiere 
decir que si a >b, y b > c, entonces a > c. En otras palabras, si se quiere me- 
dir una variable como "conservatismo" en la toma de decisiones, en el nivel 
ordinal, se puede inferir que si el director de planeación y desarrollo de la 
compañía A es más conservador que el director de finanzas, y éste es más con- 
servador que el director comercial, entonces el director de planeación y desa- 
rrollo será más conservador que el director comercial; así se mantiene la 
relación "mayor que”, para todos los individuos en estudio en el grupo. 

El concepto ordinal puede generalizarse más allá de la simple ilustración 
a > b >. Por ejemplo, cualquier número de casos se puede ordenar, mientras 
la medición ordinal habla de mayor que o menor que, se puede emplear tam- 
bién para establecer Órdenes en cualquier otro parámetro comparativo, como 
"más fácil que...", "más satisfecho que...”, "más deseado que...", etcétera, 

Los ejemplos de este tipo de escalas incluyen las escalas de opinión y de 
preferencia. La técnica comúnmente usada de " comparación por pares" es tam- 
bién una escala ordinal, ya que los números en esta escala significan solamente 
el orden. La medida de tendencia central apropiada en este caso es la mediana. 
Los percentiles o cuartiles se pueden usar para medir la la dispersión; la corre- 
lación está restringida a métodos de "clasificación de orden". Para pruebas de 
"significancia", estas escalas están restringidas a los métodos no paramétricos. 


Ejemplo de medición con escala ordinal 


Suponga las siguientes prácticas de medición de actitudes: se miden las actitudes 
haciendo varias preguntas con múltiple respuesta, las cuales pueden ordenarse 
en forma ascendente o descendente. Por ejemplo, una de las preguntas para 
medir el grado de satisfacción de los trabajadores de cierta empresa puede ser: 
¿está usted a gusto con su jefe inmediato? o ¿ está usted contento en el departa- 
mento en que trabaja? Si se pide al entrevistado que marque el número que re- 
presenta su grado de satisfacción en las tablas 9.1 y 9.2, se verá la relación entre 
conceptos y su posible contestación. 


Tabla 9.1 


Muy contento Contento Descontento Muy descontento 


(1) (2) (3) (4) 
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Tabla 9.2 
Definitivamente Definitivamente 
de acuerdo De acuerdo En desacuerdo en desacuerdo 
(1) (2) (3) (4) 


Suponga que el investigador aplica diez preguntas en la misma forma para 
medir el grado de satisfacción de los trabajadores de cierta empresa; entonces, la 
calificación más alta sería 40 (es la calificación 4 en cada una de las 10 pregun- 
tas) y la la más baja sería 10, suponiendo que los entrevistados responden a 
todas las preguntas. Se considera que el entrevistado cuya calificación es de 40 
está totalmente descontento con su trabajo y se le asigna el primer rango. A otra 
calificación cercana a 40 se le asigna el segundo rango. Se continúa así para 
asignar rangos a todos los entrevistados según sus calificaciones, Se debe men- 
cionar que en estas escalas los números no indican que los intervalos entre los 
entrevistados son iguales, ni indican cantidades absolutas; no se puede suponer 
que los números tienen distancias iguales ni que las propiedades que representan 
estos números también las tienen. En otras palabras, si dos entrevistados tienen 
el rango 7 y 5, y otros dos tienen el 4 y 2, no se puede inferir que la diferencia 
entre los dos sea igual. 

También existen escalas ordinales con "origen" natural (ver tabla 9.3). Éstas 
se deben tratar estadísticamente igual que las ordinales. 


Tabla 9.3 


+2 Totalmente de acuerdo 
+1 De acuerdo 
0 Indiferente 
— 1 En desacuerdo 
— 2 Totalmente en desacuerdo 


9.6 ESCALAS DE INTERVALO 


Estas escalas tienen las características ya mencionadas y además incorporan el 
concepto de la igualdad de intervalo; es decir, que la distancia entre 1 y 2 es la 
misma que entre 2 y 3. El calendario y las escalas de temperatura son ejemplos 
clásicos de escalas de intervalo. 

Cuando se dice que un objeto es mayor que otro, se puede especificar por 
cuántas midades un objeto es mayor que otro. Por ejemplo, con la medición de 
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intervalo es posible decir no sólo que Juan es más alto que César, sino también 
establecer cuánto más alto es; 20 centímetros, por ejemplo. 

Para comparar cuantitativamente se deben tener unidades de medición; si se 
han construido unidades de medición, entonces se ha logrado una escala de 
intervalo; algunas variables que se pueden medir con escala de intervalo son: 
altura, temperatura, tiempo, ingreso o inteligencia. Una escala de medición de 
intervalo se puede caracterizar como unidad de medición común y constante que 
asigna números reales a todos los pares de objetos en una serie ordenada. En 
este intervalo de medición, la razón de cada dos intervalos (distancia) es inde- 
pendiente de las unidades de medición. 

La estructura de la escala de medición de intervalo es tal que la diferencia 
entre las observaciones es isomórfica a la estructura aritmética. Las siguientes 
propiedades son aplicables en la escala de medición de intervalo: 


1. Singularidad: si a y b son números reales, entonces a + b, y a.b repre- 
sentan uno y sólo un número. 

2. Simetría: si a = b, entonces b=4. 

3, Conmutación: si a y b son números reales, entonces a+b=b+a, y ab 
= ba. 

4. Sustitución: sia =b, y a+c=d, entonces b+c=d ysia=byac=d, 
entonces bc = d. 

5. Asociación: si a, b y c son números reales, entonces (a + b)+c=a+(b 
+0), y (abjc = albc). 


Cuando se supone que se está utilizando una escala de este tipo se puede 
usar la media aritmética como medida de la tendencia central. También se usa la 
desviación estándar como medida de dispersión. Los procedimientos estadísti- 
cos pueden ser: correlación, análisis de la varianza y pruebas paramétricas tales 
como to f. En pocas palabras, todas las estadísticas comunes son aplicables a los 
datos de intervalos. 


9.7 ESCALAS DE RAZÓN 


Estas escalas incluyen todas las características anteriores, más el concepto de 
cero absoluto u origen a propiedades tales como las dimensiones físicas: peso, 
estatura y distancia, que tienen cero natural y que son medibles con escalas natu- 
rales. 

En las ciencias del comportamiento, pocas situaciones satisfacen los reque- 
rimientos de las escalas racionales. En administración hay varios ejemplos: los 
valores monetarios, población, tasas de recuperación y otras que son escalas 
racionales, es decir, esta escala sí existe en la investigación del área administrativa. 

Todas las técnicas estadísticas mencionadas pueden usarse en este caso, 
además de la multipicación y la división; así como las medidas geométricas y 
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armónicas se pueden usar para la medición de la tendencia central, también se 
Pueden calcular los coeficientes de variación. 


9.8 CARACTERÍSTICAS DE UN BUEN INSTRUMENTO DE 
MEDICIÓN 


Los instrumentos de medición deben ser correctos, o que indiquen lo que intere- 
sa medir con facilidad y eficiencia. Según la literatura de psicología, donde se 
habla más de medición, para la evaluación de un instrumento de medición hay 
que considerar tres características principales: 34 


+ Validez: se refiere al grado en que la prueba está midiendo lo que en 
realidad se desea medir. 

+» Confiabilidad: se refiere a la exactitud y a la precisión de los procedi- 
mientos de medición. 

+ Factibilidad: se refiere a los factores que determinan la posibilidad de 
realización, que son tales como: factores económicos, conveniencia, y el 
grado en que los instrumentos de medición sean interpretables.* 


A continuación se explican estos conceptos en detalle: 
9.8.1 Validez 


Se han mencionado muchos conceptos de validez en la literatura de la 
métodología de la investigación científica. En este texto se mencionan dos for- 
mas básicas de validez: validez externa y validez interna. La validez externa de 
los hallazgos de una investigación se refiere a la generalización de sus concep- 
tos. La validez interna es la habilidad de un instrumento de investigación de 
medir lo que se ha propuesto. A este último concepto es al que se hace referen- 
cia generalmente cuando se utiliza simplemente el término "validez". 

La clasificación más importante de los diferentes tipos de validez es la 
que prepararon en conjunto la American Association of Psychology, los nom- 
bres de asociaciones, revistas, la Asociación Estadounidense de 
Investigación Pedagógica, y el National Council of Measurement in 
Education. A continuación se presentan tres tipos de validez: validez de con- 
tenido, validez con base en criterios externos y validez de construcciones 
hipotéticas (constructos). 


*Thurstone L. L., The measurement of value, Chicago, University of Chicago Press, 1959. 
*Torgerson, W.S, Theory and Methods of Scaling, Nueva York, John Wiley €: Sons, 1958. 
“Thomgike Robert L. y Hagen Elizaberb, Measurement and evaluation in Psychology and 
Education. 3a. ed. Nueva York, John Wiley de Sons, Inc. 1969. 
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Validez de contenido 


Hay dos variedades de validez de contenido: validez superficial y validez mues- 
tral. La validez superficial se refiere a la evaluación subjetiva del investigador y 
del instrumento de medición. En la práctica, la validez superficial no se refiere a 
la pregunta de si el instrumento de medición puede medir lo que se ha propuesto 
el investigador, sino que se refiere al grado en que se está midiendo según la va- 
loración subjetiva de los investigadores. 

El problema principal con la validez superficial es que no existen reglas 
aplicables para evaluar los instrumentos de medición, y se debe confiar total- 
mente en el juicio subjetivo. De cualquier manera, la validez superficial sirve en 
el proceso de construcción y formulación de los instrumentos de medición. El 
investigador, quien está construyendo un instrumento de medición, debe confiar 
primero en su habilidad y buen juicio, y después comprobar la validez de los 
instrumentos. La validez muestral se refiere a que el instrumento contenga una 
muestra representativa del universo de la materia de interés. 


Validez con base en criterios externos 


La finalidad de esta clase de validez es la puntuación de una prueba a escala, con 
una o más unidades o criterios externos según se sepa o se crea saber. En otras 
palabras, esta forma de validez refleja el éxito de las medidas que se usan con 
algún propósito estimativo empírico. Si se considera que cierto instrumento es 
válido, entonces existirán ciertas relaciones empíricas entre los resultados pro- 
ducidos por el instrumento y otras propiedades o variables. 

De las muchas pruebas con las que se evalúa este tipo de validez, la validez 
predictiva es la que más se usa. 

Validez predictiva es la correlación entre los resultados de una medición 
dada y de un criterio externo; por ejemplo, la prueba de inteligencia se aplica 
a un grupo de alumnos universitarios de nuevo ingreso y después de un año 
de haber cursado materias, se obtiene el promedio de sus calificaciones. La 
comparación del resultado de la prueba de inteligencia y el promedio de califica- 
ciones se puede validar con la prueba de inteligencia, El coeficiente de corre- 
lación entre estos dos instrumentos de medición (prueba de inteligencia y 
promedio de calificaciones) que se conoce como "coeficiente de validez” tam- 
bién se puede usar como prueba de validez, 


Validez de constructos 


Implica relacionar un instrumento de medición con un marco teórico para determi- 
nar si el instrumento está ligado a los conceptos y a las consideraciones teóricas. 

Si las medidas de la escala se relacionan con la forma antes mencionada con 
las otras proposiciones, tal como se indicó, entonces se infiere que hay validez 
de constructos. 
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Las tres formas de validar, aunque se han tratado separadamente, están muy 
relacionadas, tanto desde el punto de vista teórico como del operacional. 


9.8.2 Confiabilidad 


Una medición es confiable de acuerdo con el grado en que puede ofrecer resulta- 
dos consistentes. En otras palabras, confiabilidad es el grado en el cual una 
medición contiene errores variables. Estas son diferencias entre observaciones o 
entre mediciones durante cualquier momento de medición, y que varían de vez 
en cuando para una unidad dada del análisis al ser medidas más de una vez por 
el mismo instrumento. Por ejemplo, si se mide con una regla la longitud de cier- 
to objeto en dos diferentes ocasiones, y se obtienen resultados diferentes, 
entonces se puede decir que la regla tiene errores variables. Por la naturaleza de 
las mediciones indirectas en los estudios de administración y contaduría, estos 
tipos de errores son más grandes que las mediciones de las variables físicas. 
Factores momentáneos como falta de inclinación, ambigiledad, instrucciones y 
dificultades técnicas, pueden causar errores variables: se le llama variable 
porque la cantidad de error puede variar de una observación a otra. 

Entonces, cada medición consiste de dos componentes; uno verdadero y uno 
falso (error). Por lo tanto, se puede definir la confiabilidad como la razón de las 
varianzas de la puntuación verdadera con la puntuación observada. 

La varianza es la descripción del grado en que las observaciones pueden 
variar de una a otra, 


> Q- 
N 


nn 
Algebraicamente, la puntuación de la observación de cada una se puede 
expresar como: 
X¡=T,+ ej 
donde: 
X;= puntuación obtenida por el individuo ¿. 
T, = verdadera puntuación del individuo ¿. 


e; = la cantidad de error ocurrida para el individuo ¡en el momento de la 
medición. 


Se puede expresar de la siguiente forma: 
0% =0%+0% 
donde: 


9?, = varianza de la puntuación observada. 
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071 = varianza de la verdadera puntuación. 
0%e = varianza de error. 


Confiabilidad es la razón de la varianza de la verdadera puntuación a la va- 
rianza de la puntuación observada, 


Confiabilidad = 1/x=(x — e) fx 


Esta fórmula explica que cuando x = e la confiabilidad será igual a cero; por 
otro lado, si no existe error variable, e = 0 y la razón sería: 


xhx=1 


donde existe confiabilidad absoluta, Entonces, la medida de confiabilidad es una 
escala de O a 1. Cuando la medición da sólo error la confiabilidad será cero y 
cuando no hay error será de 1. 

En la práctica, es imposible calcular directamente la puntuación verdadera 
en forma independiente de la cantidad de errores. Por lo tanto, la razón /x debe 
estimarse. Hay tres métodos principales para estimar la confiabilidad: 


1. Método de prueba-contraprueba. 
2, Método de formas paralelas. 
3. Método de partir por mitad. 


El método de prueba-contraprueba corresponde más a la definición concep- 
tual de confiabilidad. En este método se aplica un instrumento de medición a un 
grupo de personas en dos ocasiones diferentes y se calcula la correlación entre 
dos series de observaciones (puntuaciones). Al coeficiente obtenido en ese 
método se le conoce como confiabilidad estimada (y.x.x2 ) 


YX. = SA 1 S?x 


donde: 
va representación de la primera medición. 
2 representación de la segunda medición. 
20 = coeficiente de correlación entre X y X2. 
sto = varianza estimada de las verdaderas puntuaciones. 
Sr = varianza calculada de las puntuaciones observadas. 


El método prueba-contraprueba tiene dos limitaciones: 


1. El hecho de que un individuo haya sido examinado en una ocasión puede 
influir en la medición de subsecuentes pruebas, 
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2. Las propiedades humanas están en un estado de cambio continuo. 


El método de formas paralelas es una manera de superar las dos limita- 
ciones inherentes al método prueba-contraprueba. Por medio del método de for- 
mas paralelas se aplica a un grupo de personas dos formas diferentes de instru- 
mentos de medición y las dos series de puntuaciones se correlacionan para 
obtener la confiabilidad estimada. Este método presenta un problema, que es 
poder asegurar que los dos instrumentos de medición sean verdaderamente para- 
lelos. 


9.9 ESCALA DE THURSTONE 


Entre las escalas que determinan las declaraciones de las actitudes con base en 
jueces, la más importante es la técnica de Thurstone, conocida como "escala de 
intervalos aparentemente iguales”, Ya se dijo que las escalas tratan de distinguir 
o clasificar a los individuos según un sistema. 


100 
39 
80 
70 
60 
50 
48 


t 
2 
3 
4 
5 
$ 
7 
3 
9 


30 
29 


23 


18 


Figura 94 Escala de Thurstone, 
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La técnica de Thurstone se creó para lograr este propósito, de tal manera 
que los intervalos entre los rangos asignados por las escalas sean aproximada- 
mente iguales; es decir, una escala en la que sea posible afirmar que la distancia 
que separa a un sujeto que obtuvo una puntuación de 8,7 con respecto a otro 
Sujeto que obtuvo 6,3, es igual a la distancia que separa a otro par de sujetos que 
obtuvieron puntuaciones de 3.6 y 1.2 respectivamente; en otras palabras, la 
medición trata de establecerse a nivel intervalar. 

El procedimiento general de la técnica de Thurstone es pedir a los jueces 
clasificar a los ftems por categorías, Después, el investigador selecciona de 
estas categorías algunos ftems (usualmente quince o veinte) para formar la 
escala, Los ítems se elegirán de cada una de las categorías ordenadas dando 
preferencia a aquellos en cuyo rangos están en desacuerdo los jueces, Esto se 
conoce como Ley de Juicio Comparativo. 

El proceso de la técnica de Thurstone tiene las siguientes etapas: 


9.9.1 Recopilación de ítems 


En la primera etapa, el investigador forma un gran número de ítems, por lo 
general entre 100 y 200, relacionados con las actitudes sujetas a medición. 
Los ftems deben cubrir todos los rangos de actitudes, desde extraordinaria- 
mente favorables hasta incluyendo la neutral. Cada ítem debe preguntarse en 
tiempo presente, expresar una sola idea, ser breve, no ser ambiguo, ser rele- 
vante, y ser de manera tal que permita aprobar o rechazar las actitudes, 
Definitivamente se pueden diseñar y recopilar cantidades de ítems si se 
revisan literaturas o se realizan entrevistas informales. Cada ítem debe 
escribirse en una hoja de papel. 


9,92 Ordenar los ítems 


En esta etapa se entrega una serie completa de los Ítems a cada juez (suponiendo 
que se escogieron 150 ítems para estudiarlos) o sea que a cada juez se le entre- 
garán 150 hojas, conteniendo cada una un ítem. Se eligen los jueces con base en 
las técnicas de muestreo probabilístico para que su punto de vista represente la 
población en estudio. El número de jueces que se han empleado para contruir la es- 
cala Thurstone varía de 50 a 300 para 150 ítems. 

Se pide a los jueces que ordenen los ítems en una escala hipotética que cons- 
ta de once (11) categorías, empezando de muy favorable, neutral, hasta muy des- 
favorable. Cada juez debe ordenar los ítems en una escala, según lo favorable 
de los ítems a la actitud en estudio. Ejemplo: 


Distribución del juicio 


1 2 3 4 al 6 7 8 9 10 11 
Muy favorable Neutral Muy desfavorable 
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Es importante señalar que los jueces no escriben sus opiniones personales 
respecto a si están o no de acuerdo con los ítems, sino que solamente ponen una 
Categoría del 1 al 11 según su significado. 

Por ejemplo, suponga que se desea desarrollar una escala para medir el 
grado de satisfacción del personal de una empresa transnacional. La distribu- 
ción de la escala de juicio sería la siguiente (se entregarán 150 ítems): 


1 2 3 4 5 6 7 8 9 10 11 
Satisfecho Neutral Muy insatisfecho 


Instrucción 


"Compañero: en el sobre usted encontrará 150 preguntas respecto a si está a 
gusto en su trabajo o no, las cuales no están en ningún orden. Hay preguntas que 
pueden representar muy a gusto en el trabajo y también preguntas que represen- 
tan lo contrario. Por favor, primero lea usted cuidadosamente todas las pregun- 
tas y no indique su opinión sobre las preguntas, sino solamente asigne a cada 
pregunta un número del 1 al 11 según su criterio”. 

Ejemplo: 


1. Indicará máxima satisfacción. 

6. Indicará el punto neutral de satisfacción. 
11. Indicará máxima insatisfacción. 

5. Indicará poca satisfacción. 

7. Indicará baja satisfacción, etcétera. 


A la izquierda de cada pregunta hay un cuadro; se le pide escribir allí el 
número que usted asigne a dicha pregunta, y al terminar, por favor introdúzcalas 
en el sobre (como ejemplo sólo se presentan los primeros cinco ítems) 


O 1 Frecuentemente tiene fricción con otros empleados. 

2 De vez en cuendo llega tarde al trabajo. 

3 La empresa debe modificar las descripciones de trabajo. 

4 Corresponde al director del departamento o responsable de sección a 
resolver los problemas. 

5 El supervisor no debe estar cerca de la sección de trabajo con tanta 
frecuencia. 


a 
a 
a 
ja] 


9.9.3 Calcular la mediana 


En esta etapa se estudia la distribución de las respuestas (del 1 al 11) en cada 
ítem, según las respuestas sobre las ubicaciones del ítem dadas por los jueces. 
Primero se toma en cuenta la extensión de juicio. Obviamente, entre más 
amplia sea la extensión, más ambiguo será tal ítem. Los ítems ambiguos crean 
desconfianza y no darían resultados en nuestra escala; por lo tanto, se eliminan, 
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Se puede usar casi cualquier medidor de extensión como: rango, varianza, 
desviación estándar y semi-intercuartil, pero con el semi-intercuartil es más rápi- 
do calcular la mediana (C3, Cl); por lo tanto, se utilizan los cuartiles. 

Se necesitan las medianas para examinar la posición del ítem o el valor de 
escala; se puede calcular la mediana y los cuartiles para cada ítem usando la 
siguiente fórmula: 


] NA — Fb 
mediana = L+a Fp 
en donde: 
L = Límite exacto inferior del intervalo que contiene la mediana. 
a = amplitud del intervalo de clase (es igual a 1 en nuestro caso). 
N = número de casos. 
Fd = suma total de las frecuencias inferiores al intervalo que con- 
tiene la mediana. 
Fp = frecuencia del intervalo que contiene la mediana. 
Para los cuartiles: 
N/A — Fd 
Cl=L+a Fp 
N/4 — Fl 
C3=L+a Fp 
donde: 
Fd = Suma total de frecuencia por debajo del intervalo que contiene 
al cuartil. 
Ft oz Frecuencia por encima del intervalo que contiene al cuartil. 


El resto de las anotaciones del cuartil es igual a las anotaciones de la me- 
diana. 

No es necesario usar las fórmulas para calcular la mediana y los cuartiles; 
estos datos se pueden obtener de la gráfica de la frecuencia acumulativa. 

Es necesario obtener la frecuencia de juicio para cada ítem, a fin de graficar 
y obtener así la mediana y los cuartiles. 

Los pasos para graficar son los siguientes: 


1. Obtener la distribución de frecuencias para cada ítem, escribiendo su 
escala de juicio (del 1 al 11) y contando el número de jueces que califi- 
caron al ítem número x con 1, con 2 y así sucesivamente hasta el 11. 

Suponga que en el ejemplo de elaboración de escalas para satisfación 
en el trabajo, se tuvieron 50 jueces y la calificación de los 50 jueces al 
item número 1 fue la que aparece en la tabla 9.4. 
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2, Una vez que se tienen las frecuencias, se suman secuencialmente y se 
obtiene la frecuencia acumulativa. 

3. Al tener cada frecuencia, se saca el porcentaje correspondiente; en otra 
columna se saca el porcentaje acumulativo. 

4. Se grafica la frecuencia y el porcentaje acumulativo de manera que el eje 
horizontal tenga del 1 al 11 (escala de juicio) y el eje vertical tenga por- 
centaje o frecuencia acumulativa. 

Recuerde que para graficar porcentaje o frecuencia acumulativa, se 
debe obtener el punto medio de cada clase. 

La primera clase empieza de O al 1, la 2a. clase de 1 22, y asf sucesi- 
vamente hasta llegar a la 11a. clase que será de l0a 11. 


5. Con base en la gráfica se sacan la mediana y los cuartiles. En el ejemplo: 
La mediana = 8.5 
C3 9.3 
cl = 73 


EN 


. Selección de los ítems. Los ítems se seleccionan con base en su media y 
su dispersión. La mediana se utiliza para ubicar el peso del ítem en la 
escala. La dispersión se utiliza para ver cuáles son los mejores ítems den- 
tro de cada intervalo. La medida de dispersión es la diferencia de la dis- 
tribución intercuartil, es decir: € = €3 — Cl, 

El valor C también se llama coeficiente de ambigiiedad. La seleción 
de los ítems en cada intervalo se lleva a cabo teniendo un valor mínimo 
de C. Tal ítem se selecciona porque refleja que la mayoría de los jueces 
dieron tal categoría a dicho ítem. 

La selección actual de los ftems será entre intervalos. Este puede ser 
un punto completo de escala, media escala u otra distancia. Por ejemplo, 
si se decide que se quieren 15 ítems, se deberían escoger aquellos cuyas 
medias están más cercanas a las puntuaciones escalares 1.5, 2.0, 2.5, 
3.0, 3.5, 4.0, etcétera. Así se elabora una escala con intervalos aparente- 
mente iguales. 

. Aplicación de los ítems. Los ítems seleccionados se aplicarán en un 
cuestionario en forma aleatoria, sin considerar su valor de escala. A los 
sujetos de estudio solamente se les preguntará si están o no de acuerdo. 
Sólo se contestarán estas dos alternativas. 

Para la calificación de puntajes de los sujetos, el investigador debe 
registrar en un código los valores de la mediana adjudicados por los jue- 
ces a dos ftems seleccionados para integrar la versión final de la escala, 
Los valores intercuartiles no se utilizan para el cómputo de los puntajes 
finales de los sujetos. 

El puntaje final de un sujeto será entonces simplemente el promedio 
de los valores de escala de los ítems respondiendo en forma afirmativa o 
“de acuerdo”, 


a 
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Suponiendo que un sujeto hipotético contesta "en desacuerdo” y que 
los valores de escala evaluados por los jueces hayan sido: 


Ltem Peso del Ítem 


VDAOJAMA DY 
= 
>» 


4.6, etcétera. 
Entonces, el puntaje correspondiente al sujeto será: 
(12+1.6)/2=1,4 


Aunque, como se indicó, el procedimiento Thurstone está principalmente 
relacionado con la localización de ftems en puntos de una escala hipotética, se 
debe ser cuidadoso al tratar los valores de esta escala como números efectivos, 
como unidades que se pueden sumar e intercambiar en una continuidad lineal. 
Se está tratando con intervalos que no son iguales, sino que parecen iguales, con 
unidades más psicológicas que numéricas, que pueden o no ser iguales. Más 
aún, la división de la continuidad entre once unidades es arbitraria, de tal manera 
que no se puede pensar en una calificación de ocho como numéricamente el 
doble que una de cuatro, etcétera. 

En cualquier caso, en la contrucción de la escala, uno frecuentemente piensa 
que le gustarían más unidades de un lado del punto neutral que del otro; algunas 
actitudes parecen estar más diferenciadas en uno de los extremos de la escala, o 
ir más lejos o más profundamente, y al juzgarlos con frecuencia se hacen dis- 
criminaciones más refinadas en los extremos de la escala que en el medio. 
También se han emitido dudas al comparar las calificaciones o punteos de una 
escala con otra al tomar varias escalas de actitud. 

¿Qué se puede decir sobre la unidimensionalidad de las escalas Thurston? 
Nuestra primera guía aquí, aparte del cuidado tomado en la composición del 
“estanque de ítems”, es la eliminación de los ítems más ambiguos, los que tienen 
el rango semi-intercuartil más alto. Los ítems en los que hay un consentimiento 
general de quienes los examinan, tienen un derecho a priori de ser incluidos, 
pero esto está todavía alejado de la unidimensionalidad comprobada. Sin embar- 
go, se puede ir más lejos y administrar nuestra nueva escala desarrollada a una 
muestra de entrevistados, con instrucciones de tomar el enunciado con el que 
estén de acuerdo. Luego, se pueden analizar los resultados para comprobar la 
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consistencia interna de los ítems, Si los entrevistados que están de acuerdo con 
un enunciado particular, también señalan otros enunciados con valores de escala 
muy diferentes, los enunciados se deben rechazar, ya que obviamente contienen 
muchos elementos que son irrelevantes a la actitud que la escala debe medir. Si 
los enunciados con similitudes muy inexactas en la escala de valores han sido 
seleccionados, el enunciado se puede conservar. (Ver también el comentario de 
Jas escalas factoríales en este capítulo.) 

La confiabilidad de las escalas Thurstone tiende a ser adecuada, y además 
tiene la ventaja de que frecuentemente surge una forma paralela del análisis de 
los ítems: esto es particularmente útil cuando se estudian cambios de actitud. La 
reproductibilidad (en el sentido técnico) sería buena en el caso ideal, donde el 
entrevistado apoya un solo ítem, pero como esto ocurre muy rara vez, en este 
sentido las escalas pueden ser criticadas. La validez de estas escalas ha sido 
ocasionalmente demostrada con la ayuda de grupos de criterio, cuyas actitudes 
eran conocidas (por pertenecer a ciertas organizaciones, sus comentarios en una 
entrevista, o sus respuestas a las preguntas de tipo de ensayo), pero debido a que 
estas otras medidas pueden ser menos confiables que la escala que se está va- 
lorizando, o puede referirse a diferentes facetas de la actitud, quedan dudas. 

Uno puede preguntarse si los diferentes grupos de opiniones producen los 
mismos valores de escala. Por ejemplo, ¿producen los juicios a los negros los mis- 
mos valores que los juicios a los blancos en una escala de prejuicios raciales? 
Mediante prolongadas investigaciones experimentales se ha mostrado que los va- 
lores de la escala obtenidos de tales grupos tan opuestos, son correlativos en un 
alto grado uno con el otro, cuando los criterios más extremos se incluyen. Los 
entrevistados que presenten sentimientos negativos concernientes a la actitud par- 
tícular de que se trata, tienden a acumular los ítems en el extremo negros, tienden 
a colocar los Ítems en el extremo anti-negro de la escala y a colocar pocos ítems 
en el medio (categorías neutrales). En la práctica, quienes colocan más de la ter- 
cera parte de los ítems en la misma categoría, se deben excluir; inevitablemente, 
todos serán influenciados por sus propias actitudes, pero en la mayoría de los 
casos el efecto será pequeño y afectará muy poco el orden de los ítems. 

Es aconsejable usar como entrevistados a gente similar a los que se tiene en 
nuestra muestra de estudio; la práctica de usar estudiantes universitarios como 
jueces, se debe eliminar (a menos, desde luego, que la escala deba ser aplicada a 
una muestra de estudiantes). 

También se necesita Ja precaución requerida cuando las escalas se aplican 
interculturalmente, y cuando algunas de las escalas más viejas son reaplicadas, 
ediciones, palabras y estereotipos algunas veces sufren cambios sutiles. 


9.10 ESCALA DE LIKERT 


La elaboración de la escala de Thurstone es muy laboriosa, y casi siempre es 
difícil de conseguir un grupo adecuado de jueces. Hay otro método para ela- 
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borar las escalas. Este método se conoce como escala de Likert. Es una escala 
aditiva con un nivel ordinal. 

Likert tenía dos preocupaciones, y por ello creó su método de construcción 
de la escala. Sus preocupaciones eran: asegurar que todos los ítems midieran la 
misma cosa y eliminar la necesidad de un grupo de jueces para analizar los 
ítems. 

La construcción de la escala de Likert requiere de seis etapas; a conti- 
nuación se explica cada una: 


9,10.1 Compilar ítems 


En la primera etapa, el investigador debe compilar una serie de ítems que expre- 
sen un amplio rango de actitudes, desde extraordinariamente positivas hasta 
extraordinariamente negativas (50% - 50%). Cada ítem tiene varias alternativas 
que el sujeto debe contestar en una sola alternativa, estas expresiones (alternati- 
vas) son fijas para todos los ítems y son: 


Muy de acuerdo. 

De acuerdo. 

Ni de acuerdo ni en desacuerdo. 
En desacuerdo. 

Muy en desacuerdo. 


Por lo general se usan cinco expresiones fijas para cada ítem, pero hay oca- 
siones en que se usan 3, 4, 6 6 7 expresiones fijas. En la compilación de ítems no 
se pueden usar expresiones como: casi siempre, frecuentemente, ocasional- 
mente, rara vez y casi nunca. 

Los ítems deben tener las mismas características que se mencionan en la 
escala de Thurstone. 

Después, se deben dar puntuaciones a las expresiones (alternativas). La pun- 
tuación será 5, 4, 3,2, 1; 6 1,2,3, 4, 5, no importando si se empieza del 1 al 5 
o del 5 al 1; esto depende del investigador. Si el investigador desea que la pun- 
tuación alta en la escala presente la actitud favorable, entonces las expresiones 
(alternativas) favorables llevan puntuación 5, para "muy de acuerdo”. No impor- 
ta cómo se asigne la puntuación a las expresiones de los ftems, pero se debe ser 
consistente. 

A continuación se presentan cuatro ítems de la escala Likert desarrollados 
por Wayne K. Kirchner para medir la actitud respecto a la contratación de per- 
sonal de edad avanzada: 

1. Muchas empresas son injustas con los empleados de edad avanzada. 

Q Muy de acuerdo Q En desacuerdo 

O De acuerdo O Muy en desacuerdo 

Q Ni de acuerdo ni en desacuerdo 
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2. Pienso que los empleados de edad avanzada son mejores. 

O Muy de acuerdo Q En desacuerdo 

AQ De acuerdo O Muy en desacuerdo 
A Ni de acuerdo ni en desacuerdo 


3. Si dos personas pueden realizar bien el mismo trabajo, yo seleccionaría 


aquel que tenga mayor edad. 
Q Muy de acuerdo Q En desacuerdo 
Q De acuerdo Q Muy en desacuerdo 


O Ni de acuerdo ni en desacuerdo 


4. Pienso que los empleados de mayor edad tienen la misma habilidad de 
aprender nuevos métodos que los otros empleados. 

O Muy de acuerdo O En desacuerdo 

Q De acuerdo Q Muy en desacuerdo 

A Ni de acuerdo ni desacuerdo 

(La puntuación de esta escala es positiva, o sea, 5 a 1). 


9.10.2 Administrar los posibles ítems 


En esta segunda etapa se distribuyen los ítems a una muestra de personas (prue- 
ba piloto) seleccionada a] azar de una población con características similares a 
las de aquellos a quienes se aplicará la escala final. A las personas (prueba pilo- 
to) se les pide marcar con una cruz en el cuadro la alternativa que esté más 
acorde con su opinión. 


9.10,3 Calcular la puntuación total 


En esta etapa se calcula la puntuación total de cada persona, sumando el valor de 
cada ítem que ha marcado. Suponiendo que una persona ha marcado "muy de 
acuerdo” en el primer ítem (puntuación: 5) "ni de acuerdo ni en desacuerdo” en 
el segundo ítem (puntuación: 3), "en desacuerdo” en el tercer ftem (puntuación: 
4) y "en desacuerdo” en el cuarto ítem (puntuación: 2). Su puntuación total sería 
5+3+44+2=14. 


9.104 Determinar el poder discriminativo 


En la cuarta etapa, el investigador debe determinar las bases para la selección de 
los ítems para la escala final. Se pueden lograr estas bases en dos formas: una es 
el método de consistencia interna, en donde se correlaciona cada ítem en la pun- 
tuación total y reteniéndolos con unos coeficientes de correlación más altos; otro 
método es el análisis de ítems. Cualquiera que sea el método que se aplique, la 
idea es encontrar ítems que consistentemente separen a los ítems que tienen una 
actitud "alta”, "muy favorable" de los que tienen una actitud "baja" o "desfavo- 
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rable”. Con el método de análisis de ítems, la idea es examinar la habilidad del 
ítem o separar los muy favorables y los muy desfavorables; esta habilidad se 
llama Poder Discriminativo (PD) de los ítems. Para encontrar el Poder 
Discriminativo (PD) se utiliza el siguiente procedimiento: 


+ Ordenar las puntuaciones de las personas (prueba piloto) de manera que 
la persona con el puntaje total más alto ocupe el primer lugar; así, hasta 
llegar a la persona con el puntaje más bajo en el último lugar. 

+ Comparar el rango del cuartil (C1) con el cuartil (C3), o sea se trabaja 
únicamente con los cuartiles superiores e inferiores, es decir el 25% de 
las personas con puntuación alta y el 25% de las personas con pun- 
tuación baja. 

+ Después estos dos grupos se colocan en una tabla (25% altas y 25% 
bajas puntuaciones) en donde se indican las puntuaciones en cada ítem y 
el puntaje total de cada una de las personas. 

+ La etapa siguiente será calcular los promedios de cada ítem en cada uno 
de los grupos. Una vez calculados los valores promedio para cada ítem 
en los grupos altos y bajos, se puede calcular el poder discriminante de 
cada ítem, usando la siguiente fórmula: 


PD 
1= E Sm 
[N1- 1][N2-2] 
donde: 

to= La estadística "1" estudiante. 
PD = la diferencia entre medias de C1 y (36. 
$ la varianza de cada grupo. 
N = número de resultados en cada grupo. 


9,10.5 Selección de ítems 


Una vez calculados los valores "?" para cada ítem, se consulta la tabla de estadís- 
tica"f" (ver apéndice) y se seleccionan aquellos ítems que son significativos en 
un nivel determinado de Qt, o se pueden seleccionar directamente los ítems que 
tienen el valor de PD más grande, es decir, se tiene un valor discriminativo más 
alto. 

También se puede usar la prueba de la mediana. 

Al aplicar la prueba de la mediana, se empieza por determinar el puntaje de 
la mediana de cada ítem para los grupos alta y baja combinados. En seguida se 


La tabla hipotética 9.4 presenta cómo se calcula el PD. 
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dicotomizan los conjuntos de puntajes de la mediana combinada y se distribuyen 
los datos en una tabla 2 X 2, como la tabla 9.5. 


Tabla 9.4. Tabla hipotética para calcular el poder discriminativo. 


Número 
personas Puntuación 
Grupo por grupo 1,2,3,45 total Media PD 


25% personas 


puntuación 3.89 


25% personas 
puntuación baja 


puntualidad total 35 


media = = 3.89 


cambio de personas 


Tabla 9.5 


No. % sobre la 
mediana combinada 


No. % bajo la 
mediana combianda 


TOTAL N=nl+n 


Si el número total de casos en ambos grupos (n1 + 2) es pequeño, puede 
usarse la prueba Fischer, usando la fórmula: 


(4 + BJUC + DINA + CUB + DI 
ES AYBICIDIN! 


Si el número total de casos es significativamente grande, se puede usar la 
prueba X con 1 grado de libertad (2¡=1) usando la fórmula: 
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a N (AD — BCI — NI2P 
C=AFBCIDAFO EFD) 
Por supuesto, se seleccionan aquellos ítems cuyo valor de Ji cuadrada o el 
valor del estadístico Fisher es significativo. 


9.10.6 Prueba de confiabilidad 


Se puede hacer una prueba de confiabilidad de escalas compilando más ítems 
para dos escalas con un mínimo de 100 ítems, y dividiendo entre dos para crear 
dos procesos de construcción de escala como se indicó y después realizar una 
prueba de confiabilidad si se aplica el método de partir por mitad. 


9.11 ESCALA DE GUTTMAN 


La escala de Guttman la concibió Louis Guttman en 1940, para integrar la prue- 
ba empírica de unidimensionalidad como parte del proceso de elaboración de 
escalas, 

Las escalas de Guttiman son unidimensionales y acumulativas. 
Acumulatividad implica que los ítems se pueden ordenar por su grado de dificul- 
tad, y quien contestó afirmativamente a un ítem (pregunta) difícil, contestará 
siempre afirmativamente a un ítem menos difícil y viceversa. Un ejemplo en la 
ciencia física sería: si un objeto mide cuatro metros, es más largo que un objeto 
que mide tres metros, dos metro o un metro. 

Otro ejemplo sería: si una persona muestra actitud muy favorable para le- 
vantar inventarios, tendrá una actitud muy favorable en trabajos de contabilidad 
y la tendrá también para trabajar en el departamento de finanzas. Otro ejemplo: 
si un grupo de trabajadores mexicanos acepta trabajar con miembros de otro gru- 
po étnico, al mismo grupo no le molestará que esos trabajadores de otro grupo 
étnico sean miembros de su club deportivo, y también aceptarían habitar en el 
mismo edificio. La escala que resultará de administrar estos tres Ítems a un 
grupo de personas se ilustra en la tabla 9.6. 

Esta escala es unidimensional y acumulativa; los ftems están ordenados uni- 
dimensionalmente, en una sola dimensión subyacente y la escala es acumulativa, 
ya que ninguna de las personas tienen una respuesta negativa (desacuerdo) antes 
de una respuesta positiva (acuerdo) o no tienen una actitud positiva después de 
Una respuesta negativa. Por lo tanto, la información de la posición de la ultima 
respuesta positiva de una persona, permitirá predecir todas sus respuestas a los 
Ítems. 
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Tabia 9.6 Ejemplo hipotético de una escala perfecta de Guttman 


Ítems de la escala 
Acepta Permite Viviría en el 
trabajar en su club mismo edificio Puntuación 
Respondedor 1 n mr sotal 
A + + + 3 
B + + E 2 
Cc + - - 1 
pd = = > 0 
+ = De acuerdo; —= En desacuerdo, 


La escala de Guttman también se conoce como el método de escalograma o 
análisis de escalograma. Como se mencionó, esta escala busca una coherencia en 
las pautas de respuesta de los sujetos y esa coherencia se garantiza por medio de un 
coeficiente conocido como coeficiente de reproductividad. El rango del coeficiente 
es de cero a uno, en donde uno representa el grado perfecto de acumulatividad. En 
una escala cuya reproductividad es perfecta, las respuestas de los sujetos a todos los 
ítems pueden ser reproducidas por el solo conocimiento de su posición de rango. 

Para construir una escala de Guttman, primero se define el universo del 
tema de estudio. Supóngase que interesa determinar la actitud de las personas 
hacia los anuncios comerciales (publicidad) en la televisión. Nuestro universo 
dél tema sería la actitud del televidente hacia la publicidad. El segundo paso 
sería desarrollar ítems para realizar una prueba piloto para determinar si es posi- 
ble desarrollar escalas en este tema. Se mide el grado de conformidad de un 
tema con patrón de escala respecto de la fórmula de reproductividad. 

Coeficiente de reproductividad es un estándar mínimo para aceptar que una 
escala es unidimensional o que tiene un patrón de escala perfecto. 

Los pasos para construir la escala de Guttman se indican a continuación. 


9.11.1 Compilar los ítems 


Para encontrar y seleccionar los ítems para la escala de Guttman, el profesor 
Corden enumera tres condiciones que se deben alcanzar en el siguiente orden:? 


1. Debe tener cierta actitud hacia el objeto de estudio en el pensamiento de 
la gente entre la que se tomará el muestreo para el estudio. 

2. Debe encontrarse una serie de expresiones que tengan significado para 
los miembros del muestreo y provocar en ellos una respuesta que sea un 
indicador válido de sus actitudes. 

3. Los ítems en esta serie de expresiones o preguntas deben representar 
diferentes grados a lo largo de una sola dimensión. 


"Corden, Raymond L., Unidimensional scaling of social variables, Nueva York, Mc Millan 1977, p. 46. 
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Se seleccionan los ítems en varias formas tales como: revisar libros, revis- 
tas, periódicos y los conocimientos del mismo investigador. También pueden 
Usarse entrevistas no estructuradas. 

Después de compilar una serie grande de ítems, en las selecciones preli- 
mínares se deben escoger aquellos ítems que estén relacionados claramente con la 
actitud en estudio. Los ítems pueden ser con 2, 3, 5, Ó 7 respuestas; pero por lo 
general, se utilizan ítems de tipo Likert con cinco respuestas, tales como siguen: 

Indique qué tan de acuerdo o desacuerdo está con la siguiente expresión: 
Actualmente una persona debe dar mucha importancia a la vida diaria y no pen- 
sar mucho en el mañana. 


1. Muy de acuerdo. 4, En desacuerdo. 
2. De acuerdo. 5, Muy en desacuerdo. 
3. Ni de acuerdo ni en desacuerdo. 


9.11.2 Registrar las respuestas en escalograma 


Por lo general, los ítems relacionados por escala, se incluirán en un cuestionario 
y se aplican a un muestreo de la población en estudio. Antes de dar puntua- 
ciones a las respuestas de los cuestionarios, deben arreglarse los ftems de mane- 
ra tal que la puntuación sea para la respuesta más positiva (muy de acuerdo) o 
para la más negativa (muy en desacuerdo). 

Luego, se calculan las puntuaciones totales de cada persona ordenando los 
puntajes totales, de tal manera que las personas con puntuación mas alta queden 
arriba. Se registran los puntajes en un escalograma como la figura 9.5 donde se 
registraron las respuestas de 15 personas a 10 preguntas. Las personas se or- 
denaron según los puntajes totales de sus respuestas con un rango de 47 a 32, los 
ítems se ordenaron segun la escala esperada por el investigador. 


Entrevis- Íiem hem Íem  Íiem lem lem hem hem Punta- 
tado 8 4 6 3 jes 
7 x x Xx Xx x x x -= 7 
9 XxX o Xx ox x ox ox _xjo 7 
10 xo Xx o ox xo xo ox = 6 
1 x x x x x x - 0 € 
13 x x x x x x - =- 6 
3 Xx XX xo ox p=l- - $ 
2 xo Xx ox x= 2 > - 4 
6 xoxo ox Xd 2 == o - 4 
xoxo ox x|- == - 4 
14 xo xo ox 110.77 4 
5 xo Xxx HA 3 
15 Xx Xx ok o. o - - 3 
4 x _ xJ= z= - = - 2 
” - O - = 1 
12 z A! 
Errores 1 1 1 1 


Figura 9.5. 


ESCALA DE GUTIMAN 245 


Si la serie de ítems fuera perfecta, todas las celdas cruzadas en el escalogra- 
ma estarían en una posición sobre una diagonal que corre desde el ángulo supe- 
rior derecho hasta el ángulo inferior izquierdo, como se ve en el escalograma 
simple en la figura 9.5. Mientras más alto sea el número de desviación de esta 
diagonal, más baja será la reproductividad. 

La figura anterior es el resultado de la figura 9.6 después de arreglar 
(ordenar); primero poniendo a los entrevistados (renglones) en orden de los 
puntajes de su escala (ver figura 9.6), y después rearreglando los ítems 
(columnas) en la figura poniéndolos segun el número de respuestas positivas 
(las respuestas positivas están marcadas con una x) dados a cada ítem (figura 
9.5). 


Entrevis- hem Íiem hem lem ftem hem hem hem Punta: 


tado 1.2. 3 4 5 6 7 8 je 
1 xXx A A 
2 O O 
3 O A 
E: 
Ss x - - - x - 2 = ES 
6 A 
7 HL E] 
8 x == - x x - xo 4 
9 x x nn x x x x x 7 
10 xx A A 
1 Se 2... - 2x1 
A E RN 
13 A CA: 
14 CI E E 
15 A A a 
Figura 9.6. 


Entrevis- ftem ltem Fem hem fem hem hem lem Punta: 
de 


tado o 1 3 4 5 7 8 jes 
7 A A 
9 A 0 0 E 
10 O E 
1 Lx xo ox o -= xo -= 6 
13 xX Mm xo > XxX ox 6 
3 E] 
2 A 
6 | 
ES A 
14 Lo 2 == = Xx - Xx ox 4 
5 das ds a a 
15 A OR e 
4 A A O: 
ul = o == * 1 
12 A - 1 
2. 6 1 6 13. 2 51M 9 


Figura 9.7. 
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El procedimiento de análisis del escalograma está diseñado para que permi- 
ta conocer qué tan lejos están los ítems y las personas que respondieron a ellos 
de un patrón de escala ideal. 


9.113 Calcular el coeficiente de reproductividad 


El coeficiente de reproductividad se define como el grado de reproductividad del 
patrón de respuestas de una serie de ítems cuando se conoce el puntaje total. 
Esto depende del grado del patrón de respuestas (escala perfecta), como se ve en 
la figura 9.8. El patrón de respuestas en dicha figura está desviado de uno de 
escala perfecta. El grado de desviación se puede medir con la fórmula de coefi- 
ciente de reproductividad 


9.114 Elegir en dónde cortar 


En el proceso del cálculo de errores o inconsistencia, cada ftem se considera 
totalmente independiente de otro. Como se mencionó en un patrón de escala per- 
fecta se espera ver que en cada ítem exista una regresión hacia abajo de una 
columna a otra, o sea de 5 a 1 sin ningún cambio de dirección, como se observa 
en la figura 1, Para que se pueda contar el número de desviaciones en cada ítem, 
es conveniente cortar (quitar una línea) cada vez que el patrón de respuesta cam- 
bie de una categoría (columna) a otra. Este punto de corte se indica en la figura 
4; por ejemplo, para el ítem 1 hay un solo corte en la categoría de respuesta 
"muy en desacuerdo"(5), por lo tanto, el punto de corte sería abajo del último 
caso. Para el ítem 2, el patrón de respuesta entre el décimo y decimoprimer caso 
cambia Ja dirección de categoría de 5 a 4, se debe cortar abajo de la figura. Los 
errores están marcados con un círculo y abajo de cada columna se presenta el 
número de errores. Se puede calcular el error de reproductividad, que es la suma 
de errores entre el total de respuestas. 


e 


Error de reproductividad = “yy 
, 


Ahora se puede calcular el coeficiente de reproductividad usando la 
ecuación: 


CR=1-0.14 =0.86 
El coeficiente de reproductividad es inferior que el requerido (.90), por lo 


que se debe ajustar la escala para incrementar el coeficiente de reproductividad a 
90 o más. 
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9.11.5 Modificación de la escala 


Se puede modificar la escala rechazando los ítems que tienen relativamente 
mayores errores; también se pueden juntar las respuestas adyacentes en una sola 
categoría. Estas modificaciones se aplicaron en la escala hipotética que se explica 
en la figura 3 y se ve el resultado de estas modificaciones. Se elimina el ítem 4; en 
los ítems 1 y 3 se Itenaron las respuestas de categoría 4 a la 6, y en el ítem 6 las 
categorías 3 y 4 se combinaron. La puntuación total se calculó después de la mo- 
dificación y el total del número de errores. Con estos cambios el número de 
errores se ha reducido a 9, por lo que se puede recalcular el coeficiente de repro- 
ductividad. 

Como se observa, con modificaciones, la escala obtuvo un coeficiente de 
reproductividad mayor de .90, lo que indica que la escala tiene las características 
de unidimensionalidad y acumulatividad. 

El procedimiento de análisis de escalograma fue un intento pionero para 
desarrollar escalas homogéneas. Varios investigadores han criticado la escala de 
Guttiman, especialmente por su carácter unidimensional. 

Se ha criticado que el coeficiente de reproductividad no es un elemento sufi- 
ciente para asegurar la unidimensionalidad? aunque fueron desarrolladas 
mejores medias que en coeficiente de reproductividad. Todavía se sigue criti- 
cando el uso del escalograma. Robins dice que el modelo de Guttman no es 
apropiado para describir la estructura de muchos fenómenos sociales?; él propu- 
so que el uso más apropiado de los escalogramas es entre los comportamientos 
sociales que están bien entructurados. 

El modelo de la escala de Guttman es un método muy avanzado y útil. El 
hecho de que con menos ítems se puede desarrollar la escala es atractivo. Si a 
los alumnos les parece que el análisis de escalograma es muy laborioso, y que 
cuando hay muchos Ítems y muchos entrevistados se dificulta el análisis, se 
pueden utilizar máquinas electrónicas para procesamiento de datos, usando 
paquetes como Scalogran Board Techniques. 


9,12 ESCALAS MULTIDIMENSIONALES 


Este término describe un conjunto de técnicas que tratan con espacios apropia- 
dos de uso más general que el diferencial. 


¿Scooler, Carmi. A Note of Extreme Caution on the Use of Guttmann Scale. American Journal of 
Sociology, Vol. 29, Jun. 1966. 

SRobinson, John P. Towards a More Appropiate Use of Guttmann Scaling. Public Opinion 
Quarterly. 

YFord, RN. Arafid Scoring Procedure for Scaling Attitude Questions, Sociological Studies in Scale 
Analysis. New Brunswick, N.J. Rutger University Press, 1954. 
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Semántico. Con este método se pueden definir objetos, individuos o ambos, 
con un mínimo de información. 

Se puede pensar en tres tipos de espacios de atributos, cada uno represen- 
tando un mapa multidimensional. Primero, hay un espacio objetivo en el cual un 
objeto puede ser posicionado en términos de, por ejemplo, sabor, peso y valor 
nutricional. También hay un espacio subjetivo en el cual las percepciones de 
una persona respecto al sabor, peso y valor nutricional pueden ser posicionadas. 
Estas medidas de atributos, objetivas y subjetivas, pueden coincidir pero en ge- 
neral no sucede así. Varios individuos pueden tener diferentes percepciones de 
un objeto al mismo tiempo y éstas se pueden promediar para presentar una medi- 
da sumaria de las percepciones. Con otro “mapa” se pueden describir las prefe- 
rencias en términos de los atributos de los objetos. Esto representa lo "ideal"; 
todos los objetos cercanos al punto ideal se interpretan como preferidos por 
nosotros sobre aquellos que están más lejanos. 

Las escalas multidimensionales no se han aplicado a problemas reales en los 
negocios todavía; sin embargo, representan un futuro instrumento para la inves- 
tigación de actitudes y preferencias. Ya se está progresando al respecto. 


9.12.1 Clasificación de escalas 


Existen varias clasificaciones, pero lo que interesa aquí es la relacionada con las 
ciencias sociales. Como no hay una sola opinión aceptada totalmente, se men- 
cionan estos enfoques: 


+ Objetivo del estudio. Una escala puede ser desigrada para medir las ca- 
racterísticas de los entrevistados o usarse para que ellos sean guía de los 
objetos o estímulos que se les presentaron. 

+ Escalas de respuesta. Las escalas pueden clasificarse en "categóricas” y 
"comparativas". Las primeras se usan cuando los entrevistados marcan 
un objeto sin preferencia directa por otros objetos. En las comparativas, 
a los entrevistados se les dirige a escoger una de las varias opciones rela- 
cionadas. 

+ Grado de preferencia. Los enfoques de escala pueden incluir medidas de 
preferencia o evaluación de no preferencia. En el primer caso los entre- 
vistados escogen cuál objeto prefieren. En el segundo, ellos deben juzgar 
cuál objeto o solución tiene las características pedidas sin ninguna prefe- 
rencia personal hacia el objeto o las soluciones. 

* Propiedades de las escalas. En el capítulo 5 se mencionó que las escalas 
se pueden clasificar como: nominales, ordinales, de intervalo y de razón. 

+ Número de dimensiones. Las escalas pueden ser unidimensionales o 
multidimensionales. En el primer caso se busca medir sólo un atributo 
del entrevistado o del objeto. Las escalas de dimensión múltiples recono- 
cen que un objeto se puede describir por un concepto y un atributo de 
múltiples dimensiones en lugar de una sola. 


CAPÍTULO 


10 


Procesamiento de datos 
por computadora 


10.1 INTRODUCCIÓN 


En el análisis de datos para los estudios de mercado, luego de recopilada toda la 
información, el elemento más importante es su procesamiento, de manera que 
permita obtener resultados coherentes, rápidos y exactos, así como la realización 
de los cálculos necesarios y los análisis estadísticos que se requieran. Cuando se 
manejan pocos datos, digamos, menos de 40 o 50, esta información puede mane- 
jarse manualmente o mediante una calculadora, y pueden realizarse algunas 
estadísticas descriptivas como la media, la mediana, la desviación estándar, el 
rango, e incluso histogramas, curvas y otros gráficos; pero cuando los datos que 
se recaban son numerosos, el manejo de información para estudios estadísticos se 
hace exponencialmente complejo, y las posibilidades de cometer algún error son 
mucho mayores. Es aquí cuando se hace necesario el uso de un computador, 
Cualquier investigador en las áreas de economía, administración y mer- 
cadeo deberá familiarizarse con las computadoras; su uso, manejo y los progra- 
mas disponibles para el tipo de trabajo que se desee realizar. En la actualidad, 
para la inmensa mayoría de los trabajos de investigación de mercado, los 
computadores llamados “personales” han adquirido una capacidad tal de proce- 
samiento de datos, que ya no es necesario el uso de los grandes mainframes 
existentes en las universidades y empresas más grandes; de hecho, redes locales 
de microcomputadores están sustituyendo exitosamente mainframes de formato 
“mini”, como la IBM AS 400. Por ejemplo, los primeros computadores persona- 
les, o PCs, que usaban microprocesadores Intel de primera generación, tenían 
una velocidad de unas 0.33 MIPS (Millones de Instrucciones por Segundo). En 
comparación, los computadores grandes, o mainframes, alcanzaban velocidades 
de hasta 100 MIPS, ¡trescientas veces mas rápidos! Hoy en día, los nuevos chips 
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Intel Pentium PS utilizados por los nuevos microcomputadores sobrepasan las 
100 MIPS, y actualmente se trabaja en al menos dos sucesores aún más veloces. 

En este estudio nos limitaremos, por lo tanto, al microcomputador, cómo 
trabaja, sus principales componentes y los programas de trabajo de uso más fre- 
cuente para el usuario en lo general, y el investigador de mercados, en lo par- 
tícular. 


10.2 EL MICROCOMPUTADOR 


Desde su introducción en 1977, ninguna otra máquina, aparato o dispositivo ha 
alterado más el curso de la humanidad que el microcomputador. Su presencia es 
ya evidente en cada aspecto de nuestras vidas; en nuestros trabajos, en nuestros 
centros de enseñanza, y hasta en nuestros hogares. 

La arquitectura de los microcomputadores sigue los mismos conceptos fun- 
damentales de las primeras computadoras. Las operaciones básicas de cualquier 
computador, desde la calculadora de bolsillo hasta una gigantesca mainframe, 
pueden sumarizarse en cuatro: 


+ Ingreso de la información. 

+ Procesamiento de la información. 

+ Almacenamiento de la información. 
+ Salida (presentación) de resultados. 


La figura 10.1 enseña gráficamente la relación entre estas operaciones bási- 
cas. 


PROCESAMIENTO 


Figura 10.1 Relación entre las funciones básicas en un computador. 
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10.2.1 Ingreso de la información 


Es el proceso mediante el cual se incorpora data “cruda” al computador. Existen 
varios accesorios o “periféricos” mediante los cuales se introduce la información 
en la computadora. Los principales son: 


+ Teclado. 

+ Mouse tratón). 

+ Scanner. 

+ Ingreso remoto (redes, internet, modems). 

+ Ingreso desde una unidad de almacenamiento: disquete, CD (disco láser), 
tape, disco duro. 

» Sistema de reconocimiento de voz, lectoras de códigos de barras, input 
directo de parámetros, etcétera. 


El computador, utilizando su capacidad de procesamiento de datos (CPU o 
Central Processing Unit) su memoria, y los programas (software) a los que tiene 
acceso desde su almacenamiento (disco duro, por ejemplo), está listo para traba- 
jar; pero ahora requiere que se le proporcionen datos. 


El teclado: 


El teclado es la más tradicional forma de ingresar información al computador. El 
teclado es un dispositivo que consiste en un grupo de botones que el operario 
oprime para introducir información al computador. Fue diseñado basándose en 
los teclados de las máquinas de escribir, llamado sistema “QWERTY”, por la 
disposición de las teclas en la primera fila, con el fin de aprovechar el 
conocimiento existente en mecanografía. Hoy en día todos los teclados se han 
estandarizado, y con muy pocas excepciones, son intercambiables y muy 
económicos. 


El ratón: 


Con este curioso nombre (debido a su forma) se conoce al dispositivo puntero 
más frecuentemente utilizado hoy día. Desde los años 30, Apple Computer intro- 
dujo el puntero o mouse (ratón en inglés) para trabajar con su modelo 
Macintosh. El uso de programas como Windows de Microsoft ha hecho impres- 
cindible el uso del mouse en los equipos IBM y sus clones. El mouse consiste en 
un pequeño dispositivo diseñado ergonómicamente para que la mano repose 
sobre él, con una bola rodante en su parte inferior. Un puntero o cursor en la 
pantalla imita los movimientos del ratón sobre una superficie plana, y uno O va- 
rios botones en el ratón realizan las acciones de escoger, seleccionar, arrastrar, 
mover, etcétera. Casi todos los desarrollos de software se han adaptado al uso de 
éste u otros dispositivos puntero, para facilitar la interacción con el usuario. 
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Otros dispositivos de uso similar son el trackball, el lápiz puntero, el mouse 
inalámbrico el touch pad, etcétera. 


El scanner:! 


El scanner es un aparato que toma una impresión digital de una página, sea de 
texto, de gráficos o ambos y la digitaliza, de forma que se convierte en una larga 
secuencia de ceros y unos para su posterior ingreso a un computador. 
Posteriormente, éste puede manejar esta información como una página gráfica 
en la memoria (bitmap) o en algunos casos puede reconocer los caracteres de la 
página y entonces posibilita que sean procesados como caracteres de texto o 
números. Este tipo de scanners hace mucho más rápido el ingreso de data al 
computador, ya que normalmente el elemento más lento en todo el proceso es la 
capacidad de introducción de datos que tenga el usuario desde el teclado. 


El fax-modem: 


El fax-modem representa uno de los mayores avances en el ingreso y trans- 
misión de datos desde y hacia una computadora, Consiste en una tarjeta instala- 
da en uno de los puertos de comunicación de los que está provisto el 
computador, comúnmente el puerto serial llamado COMI, con conectores hem- 
bra para la línea telefónica y, usualmente, para un teléfono conectado en serie. 
Esta tarjeta puede establecer una conexión telefónica con otra computadora o 
con un aparato de fax, y enviarle información digitalizada a alta velocidad. Las 
velocidades de transmisión de datos ban ido incrementándose en la medida en 
que la tecnología avanza. Los modelos iniciales transmitían información a una 
velocidad de 1200 baud. Un baud es una medida de los cambios de estado de 
una frecuencia a otra; comúnmente, en un sistema monobit, un baud corres- 
ponde a un bit por segundo, así que los modems iniciales transmitían a 1200 bits 
por segundo; posteriormente, 2400, luego de 9600 y hoy día los hay de hasta 
34 400 baud, Cuando se trata de un fax, el computador puede enviar cualquier 
texto, mensaje o gráfico a otro equipo de fax o computador, utilizando algún 
programa de gráficos, de edición de textos u otro, por medio del programa con- 
trolador que viene con la tarjeta fax/modem, y que debe instalarse en el compu- 
tador. La tarjeta fax tiene la ventaja con respecto al fax convencional, de que la 
información no requiere estar en forma de papel, sino que puede enviarse direc- 


1 Scanner en español se diría dispositivo explorador. En ésta y muchas otras grafías de uso frecuente 
en informática y computación, nos encontramos con que la terminología original en inglés es tam- 
bién empleada en español y con que el uso de las siglas y términos anglosajones se ha generalizado 
hasta el punto de formar parte del léxico común en Iberoamérica. Ejemplos de esto lo constituyen 
términos como atouse, PC (personal computer), CD (Compact disk), CPU, motherboard, scanner, 
RAM, ROM, etcétera. 
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tamente desde la pantalla hasta su destino. Similarmente, al recibir un fax por 
computadora, el usuario puede recibirlo, leerlo, estudiarlo y archivarlo sin que 
este fax haya sido impreso en papel; por otro lado, el costo de una tarjeta fax- 
modem oscila por el orden de la cuarta parte del de un aparato de fax (y éstos no 
tienen modems). 

En el caso del modem, el computador está capacitado para contactar a otro 
computador en la línea, y enviarle datos, archivos, y hasta programas; en otras 
palabras, el modem envía información procesable, de manera que hace innece- 
sario imprimir información, enviarla por correo o fax y luego el tedioso proceso 
de reingresarla por teclado. Finalmente, el fax/modem por computador permite 
la conexión del computador al más novedoso y avanzado sistema de red global 
de computadoras, que es el llamado Internet. 


Otros sistemas de ingreso de información: 


Si bien no tan populares o asequibles aún, es conveniente mencionar, por ejem- 
plo, los sistemas de reconocimiento de voz. Un micrófono instalado en la 
computadora capta los comandos del operario, los interpreta y los convierte en 
caracteres gráficos. Si bien esta tecnología es lenta, costosa y aún no muy con- 
fiable, se están realizando grandes esfuerzos para desarrollarla, y es bien seguro 
que en el futuro cercano, los comandos verbales sustituyan en gran parte la 
introducción de comandos por medio del teclado. 


10.2,2 El procesamiento de la información 


Cuando la información es alimentada al sistema, es almacenada en una memoria 
temporal del computador llamada buffer, hasta que el microprocesador está listo 
para procesarla, El procesamiento de datos se lleva a cabo en un componente 
crítico del computador llamado Unidad Central de Procesamiento, o CPU, por 
sus siglas en inglés (Central Processing Unit). El CPU tiene dos componentes: la 
unidad de control y la unidad Lógica/Aritmética o ALU. 

El microprocesador es el cerebro del computador. De él depende en gran 
parte la velocidad del computador y su “inteligencia”. Consiste de delgadísimas 
capas de sílice con minúsculos circuitos integrados y decenas de miles de tran- 
sistores inteligentes. La unidad de control del CPU maneja las operaciones inter- 
nas y dirige las instrucciones apropiadas a los elementos adecuados del ALU. La 
Unidad Lógico Aritmética lleva a cabo las operaciones reales de computación, 
que son sólo siete: suma, resta, multiplicación y división, y las operaciones lógi- 
cas “menor que”, “igual a” y “mayor que”. 


10,2.3 Breve historia de los mieroprocesadores de Intel 


Los microprocesadores han evolucionado significativamente en las últimas dos 
décadas, como veremos a continuación. Una gran precursora de los microproce- 
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Figura 10.2 Elementos básicos de la tarjeta principal (motherboard). 


sadores ha sido la firma INTEL que, así como MOTOROLA, ha sido protago- 
nista de los avances de los microprocesadores. Hoy por hoy, los CPUs produci- 
dos por Intel son virtuaimente el estándar de la industria, con competencia por 
parte de otras firmas como Cyrix y AMD. Los principales chips desarrollados 
por Intel han sido: 


Intel 8088: 
1979. Comunicación de 8 bits. Velocidad: de 4.77 a 10 MHz.? Fue la base del 
primer microcomputador de IBM, llamado PC. 
Su velocidad en Millones de Instrucciones por Segundo: 0.33 MIPS 
Intel 80286: 


1984. El “286” constituyó un extraordinario avance con respecto al 8088. Su 
arquitectura de 16 bits se convirtió en la base para las unidades Advanced 


2 Un MBz o megahertz, representa un milión de “ciclos de reloj” para cada tarea fundamental del 
microprocesador. Mientras mayores sean sus MHz, más rápido será el computador. 


EL MICROCOMPUTADOR 257 


Technology de IBM, conocidas como modelos AT, permitió al computador 
efectuar varias tareas simultáneamente (multitasking). Desafortunadamente, esta 
capacidad permaneció desaprovechada, ya que no existía el software para uti- 
lizarla, hasta que la firma Microsoft introdujo el primer programa de multitareas: 
Windows/286. Su velocidad era de hasta 20 MHz. 

Millones de Instrucciones por Segundo: 3 MIPS. 


Intel 80386: 


1937. Un nuevo salto hacia adelante respecto a los previos chips, adquirió una 
inmensa popularidad, ya que tanto Windows como muchos programas 
disponibles bajo ambiente Windows, se crearon o evolucionaron a fin de sacar el 
máximo provecho de las posibilidades que ofrecía. Utiliza líneas de comuni- 
cación de 32 bits entre el chip y el BUS de datos externos. Incorpora mayor fle- 
xibilidad y velocidades mucho mayores. Promueve una variedad de velocidades 
de reloj: 16, 20, 25, 33 y 40 MHz. 

Tiene versiones de 16 bits para el BUS de data externa, denominado 
803868X, y de 32 bits, denominado 80386DX. 

Millones de Instrucciones por Segundo: 11 MIPS. 


Intel 80486: 


1990. Es una versión “turbo” del 386. El salto adelante no fue tan grande como 
el del 286 hacia el 386. Sin embargo, el procesador 80486 incorpora un contro- 
lador interno de memoria caché de 8KB que optimiza las operaciones del CPU a 
través de una memoria especial que forma parte del chip, lo cual se traduce en 
procesamiento más rápido y mejor rendimiento de la Unidad Lógico/Aritmética. 
Dispone además de un coprocesador matemático incorporado (el 386 tiene que 
utilizar un chip separado), cuya función es facilitar las operaciones matemáticas 
complejas y las aplicaciones de dibujo y diseño. 

Mediante un procedimiento llamado clock doubling, el procesador 80486 
logra una velocidad mucho más alta, ya que permite al chip efectuar dos tareas 
en lugar de una por cada ciclo de reloj interno. 


Velocidad del 80486 DX2 = 50 MHz. 
Velocidad del 80486 DX4 = 100 MHz. 


Millones de Instrucciones por Segundo: 41 MIPS. 


Intel Pentium PS: 


1994. El último avance de Intel respecto a microprocesadores es el chip 
PentiumPS, o 586. Su arquitectura interna incluye dos CPU 80486 que garanti- 
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Figura 10.3 Evolución de la velocidad del microprocesador. 


zan un verdadero procesamiento dual. Es un chip de 32 bits, lo cual le permite 
trabajar a un nivel de velocidad y sofisticación muy superiores a su predecesor, 
el 486. Tiene acceso independiente a una memoria caché múltiple, compatibili- 
dad con los chips 486 y 386, velocidad de hasta 166 MHz, y un diseño super 
escalar que utiliza una combinación de instrucciones RISC (Reduced Instruction 
Set Computing). El Pentium ha incitado a los fabricantes de software a producir 
programas cada vez más sofisticados, que resuelven problemas cada vez más 
complejos en menor tiempo y con mayor facilidad y número de opciones para el 
usuario; sin embargo, como es un chip compatible con los anteriores, los usua- 
rios que poseen chips Pentium, pero no usan programas diseñados para una 
arquitectura de 32 bits que le sacan el máximo provecho a este procesador, sólo 
verán un atractivo aumento en la velocidad de procesamiento, mientras que los 
usuarios que actualicen su software para trabajo con este chip, verán realmente 
las formidables características que posee. 
Millones de Instrucciones por Segundo: más de 100 MIPS. 


10.2.4 El almacenamiento de la información 
La memoria de un computador es uno de sus elementos más importantes. Tal 


como su nombre lo indica, es la parte en la cual se almacena información de uso 
constante. Cuando el computador recibe información del exterior, sea por medio 
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de disquetes, teclado, línea telefónica, etcétera, parte de esta información deberá 
mantenerse en un bloque de memoria al cual el computador tenga acceso instan- 
táneo. Existe además un cúmulo de información al que el computador deberá 
tener acceso desde que se prende, a fin de “cargar” el sistema operativo (el 
lenguaje que la máquina utiliza y las instrucciones iniciales de configuración). 
La memoria cumple además funciones de continuo, como almacenaje provisio- 
nal mediante complicados procesos de optimización de uso de recursos. 
Los principales tipos de memoria del computador son: 


Memoria RAM: 


Es la memoria de trabajo, de acceso instantáneo utilizada por los programas y el 
CPU del computador. RAM quiere decir Random Access Memory (Memoria de 
Acceso Aleatorio). Es una memoria volátil. Esto quiere decir que en cuanto el 
computador se apaga, la información desaparece; RAM se borra. 

En la medida en que los programas disponibles se han ido haciendo más 
sofisticados, los equipos de computación requieren mayor cantidad de memoria 
RAM. Los computadores actualmente poseen configuraciones muy variadas de 
memoria, y usualmente se puede instalar memoria adicional. Los módulos de 
memoria RAM son unos chips que están instalados en unos pequeños circuitos 
impresos llamados SIMM, Single In-Line Memory Modules, que quiere decir 
módulos individuales de memoria en línea. Los SIMMS son disponibles en 1, 4, 
16, o 32 Megabytes de capacidad, y se instalan en ranuras de expansión dispues- 
tas en la tarjeta principal (Motherboard). 

La velocidad con que el CPU accede a la información ubicada en RAM es 
sumamente alta; hasta mil veces más rápida que otras formas de almacenamien- 
to; por lo tanto, cuando se dispone de una gran cantidad de memoria en RAM, el 
computador trabaja con mucha mayor rapidez, ya que puede instalar en RAM 
programas completos o mayor cantidad de información, con lo cual no tiene que 
ir al disco duro a buscarla. Esto hace que algunos usuarios avanzados 
aprovechen esta circunstancia para crear “unidades de disco” virtuales, que sólo 
existen en memoria RAM, y que permiten trabajar desde RAM a altas veloci- 
dades. 


Memoria ROM: 


La diferencia fundamental entre la memoria ROM y la memoria RAM es que 
ROM es una memoria permanente, no volátil. Es una cantidad de memoria desti- 
nada a ciertos programas que el computador requiere apenas se enciende. Se uti- 
liza para cargar la configuración del sistema, a fin de que el computador pueda 
entender sus funciones básicas. ROM quiere decir Read-Only Memory, memoria 
sólo de lectura, lo cual quiere decir que ni el usuario ni el computador tienen 
acceso a escribir sobre esta memoria o a borrarla, Existen, sin embargo, chips de 
memoria llamados PROM y EPROM, que otorgan al usuario facilidad de repro- 
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gramación y de borrado; de allí sus nombres. PROM es Programmable Read- 
Only Memory, mientras que EPROM es Erasable Programmable Read-Only 
Memory: memoria sólo de lectura borrable y programable, 


Unidades de almacenamiento 


Fundamentalmente, las unidades de almacenamiento en un computador son las 
unidades de disco duro y disco flexible o “floppy”. En ambos casos, se trata de 
Una o varias láminas circulares de material plástico o metálico recubiertas de 
material magnetizable de grabación de bits electrónicos. Es una tecnología, por 
cierto, casi idéntica a la usada en las cintas de audio y video: un cabezal de 
grabación, o de lectura/escritura magnetiza pequeñas partículas de información 
electrónica en un medio de grabación especialmente recubierto. Los puntos 
magnetizados representan unos (1), mientras que los no magnetizados represen- 
tan ceros (0). 

Por medio de un proceso de formateo se crea la división lógica del disco en 
dos configuraciones muy pequeñas: círculos concéntricos, que se llaman pistas o 
tracks, y divisiones radiales que se llaman sectores, o sectors. 


Discos flexibles (floppies o disquetes). Permiten ei traslado de la información 
desde un computador a otro, Los floppies pueden contener archivos de texto, 
gráficos o programas. Los disquetes son de dos tamaños: 5 1/4 pulgadas, y 3 1/2, 
La capacidad de almacenamiento es de 1.2 megabytes en los de 5 1/4” y 1.44 
megabytes en los de 3 1/2. Hoy en día, los disquetes de 5 1/4” han desaparecido 
virtualmente. 


Disco duro. Es el principal centro de almacenamiento de información en el 
computador. Los discos duros han ido incrementando su capacidad interna, a 
medida que su tamaño y peso se ha ido reduciendo. En los años setenta, los 
computadores personales no poseían disco duro. Toda información tenía que ser 
cargada al encender el equipo; luego, desde unos 70 megabytes en los años 
ochenta, en 1994 los discos duros alcanzaron 1.0 gygabytes (un gigabyte es un 
millón de bytes) y dos años más tarde ya existen en el mercado unidades de más 
de 2 gygabytes. El otro criterio importante es la velocidad de acceso del CPU al 
disco duro. Esto está determinado por las interfases de disco duro, siendo las 
más utilizadas las llamadas SCSI (Small Computer System Interface) y la IDE 
Untelligent Drive Electronics). La velocidad de acceso de un disco duro está 
actualmente por el orden de los 10-20 milisegundos. 


Otros tipos de sistema de almacenamiento que cabe destacar son: 


Discos duros externos. Son unidades de disco duro que se conectan al compu- 
tador por uno de sus puertos de entrada, y permiten tener acceso a programas y 
datos. Tienen un tamaño bastante reducido y capacidades superiores a 1 
gygabyte de memoria. 
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CD ROM. El CD o Compact Disc es un disco plástico en el cual viene grabada 
de fábrica una gran cantidad de información. Ésta se recupera por medio de un 
cabezal lector provisto de un haz láser. Su capacidad de almacenamiento, así 
como la velocidad de acceso a su información es muchísimo mayor que la que 
ofrecen los sistemas magnéticos, como los floppies o cintas. Como su nombre lo 
indica, son Read-Only Memory, no permiten escribir o guardar data en ellos. Al 
momento de esta edición, aún no son del dominio público los nuevos sistemas 
de discos láser con capacidad de almacenamiento; o sea, grabables. Una vez que 
se hagan de uso común, sin duda revolucionarán una vez más el ágil mundo de 
la computación, ya que incrementarán tremendamente la capacidad de almace- 
namiento de datos, mientras que las velocidades de acceso que ofrecen, permiten 
una capacidad de procesamiento gráfico y animación sin precedentes. 


Tape backup. Se trata de Sistemas que utilizan casetes para almacenar grandes 
cantidades de información del disco duro. Tienen la ventaja de ofrecer un respal- 
do de data de gran capacidad, y a un precio muy asequible. La desventaja funda- 
mental radica en que no pueden usarse sino para guardar y recuperar 
información en grupos completos, No pueden emplearse para intercambio con- 
tinuo de información como un disco duro, sino que hacen un respaldo de todo o 
una buena parte del disco duro y luego se pueden recuperar en bloques comple- 
tos. No son un archivo de trabajo, sino de respaldo o backup. 


Redes interconectadas. En la actualidad, la interconexión de computadoras en 
redes, llamadas LAN (Local Area Networks), es una de las actividades que han 
ganado mayor auge en el mundo de la informática. Utiliza un microcomputador, 
modificado en cuanto a su velocidad y su capacidad de almacenamiento llamado 
server o servidor, y una red de cableado, usualmente de fibra Óptica o de cable 
twin axial, así como conectores especiales. Aparte de una tarjeta de comunica- 
ciones en cada computador, el sistema de red generado requiere de un programa 
de operación diseñado para permitir a los computadores operar interconectada- 
mente, como por ejemplo, el Netware 3.12 de NOVELL. En la actualidad 
provee la posibilidad de interconectar desde 5 hasta 250 usuarios con la posibili- 
dad de intercambio de datos y acceso de información, y de crear diversos niveles 
jerárquicos de acceso a la información. 


Internet. Con éste y otros nombres como WWW (World Wide Web), se conoce 
esta gran red de computadores conectados a través de modems. Esta red, como 
un inmenso sistema neural que abarca todo el planeta, maneja una casi infinita 
cantidad de información. Sus usuarios se cuentan ya por millones, y diariamente 
sigue adquiriendo mayor relevancia, El futuro de la computación está sin duda 
asociado a Internet. Ya las grandes empresas telefónicas ofrecen este servicio 
conjuntamente con el teléfono; a través de Internet el usuario puede comunicarse 
con otros usuarios en cualquier parte del mundo, casi sin costo alguno. Se puede 
averiguar casi cualquier información científica, financiera, bursátil, política, 
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meteorológica, entretenimientos, etcétera. El potencial de mercadeo es 
inagotable. Actualmente se puede adquirir una inmensa cantidad de bienes y ser- 
vicios a través de esta red, con crecientes sumas de dinero cambiando de manos 
en forma electrónica. A través de Internet, el usuario, empleando software orga- 
nizador y buscador de información como Netscape por ejemplo, tiene acceso a 
bases de datos y bibliotecas de los principales organismos y centros de docencia 
e investigación del mundo. Periódicos, revistas, libros, círculos de conversación; 
toda persona, organización o iniciativa que posea alguna relevancia, está estable- 
ciendo una presencia permanente en Internet, lo que hace que aquellas personas 
que no capten la importancia de mantenerse al día respecto a esta nueva tec- 
nología informática, se desfasarán con respecto a la población inteligente de 
nuestras sociedades, y pagarán un alto precio a la larga. 


10.2,5 La salida de la información 


Evidentemente, la mayoría de los sistemas que se acaban de explicar para alma- 
cenar e ingresar información al computador también sirven para que el compu- 
tador emita o comunique información. Éste es el caso, por ejemplo, de los 
sistemas de almacenamiento, en donde una salida de resultados puede ser hacia 
un disco externo, o hacia un disquete; o una salida de información puede ser 
hacia un modem, una red local, o hacia Internet, pero los dos sistemas tradi- 
cionales de presentación de resultados de una computadora son la pantalla de 
video y la impresora. 


La pantalla de video: Es la principa) forma de salida de información del 
computador. La evolución de esta tecnología ha traído como resultado un gran 
avance respecto a la definición y a la cantidad de colores que puede presentar. 
La definición de una pantalla se expresa por los pixels, que no son más que el 
número de puntos de luz-color que ésta pueda presentar por área. En la actuali- 
dad, en la categoría de pantallas CRT, o tecnología de rayos catódicos como los 
televisores, las pantallas presentan una definición de 800 líneas horizontales 
por 600 verticales con 256 colores. La evolución de las pantallas ha avanzado, 
desde la monocromática, que aún se utiliza, hasta las pantallas en colores; de 
las cuales la primera fue la standard IBM RGB, luego la CGA (320 X 200, 16 
colores); posteriormente la EGA (640 X 350, 64 colores), y luego la VGA (con 
dos opciones: 640 x 480, 16 colores, o 320 X 200 con 256 colores). 
Actualmente, las mejores pantallas son las SVGA, o Super VGA, con 800 X 600 
pixels de definición y 256 colores. Actualmente se están utilizando también pan- 
tallas más grandes: 14”, 15”, 17”, etcétera. 

Otro tipo de pantalla que merece la pena mencionar son las de LCD (Liquid 
Quartz Display). Las computadoras portátiles utilizan este tipo de pantalla, que 
presenta una muy alta definición en una pantalla de tan sólo 4 o 5 centímetros de 
espesor. 
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Impresoras. Desde las impresoras de matriz de puntos, ya en franca decadencia 
excepto para aplicaciones de altos volúmenes de impresión en papel de forma 
continua, que iniciaron con nueve pines en el cabezal de impresión, y una cali- 
dad de impresión realmente pobre, la tecnología de impresoras ha avanzado 
enormemente. Hoy día, las impresoras por chorro de tinta (inkjet) logran una 
definición y una velocidad de impresión mucho mayores, a un costo en constan- 
te reducción. Las impresoras láser ofrecen una calidad de impresión comparable 
a la de una máquina tipográfica, a una velocidad bastante alta, y con la opción de 
imprimir a todo color. La capacidad de las actuales impresoras para colores per- 
mite resultados que se comparan ya a los de una fotografía, a costos y veloci- 
dades que viajan en direcciones opuestas. 


Otras formas de salida de información de las que el usuario del computador 
dispone son: 


Redes. Tal como se mencionó anteriormente, la red interconectada de compu- 
tadores permite al usuario volcar la información en ella, con lo que permite el 
acceso a otros usuarios en forma de presentación en pantalla, en forma escrita, o 
tal vez como entrada de datos a otros procesos de computación. 


Fax-modem. La información/data puede enviarse también en forma remota, por 
medio de la línea telefónica, a través de un modem. Esto requiere que ambos 
equipos, transmisor y receptor, estén conectados a la línea telefónica por medio 
de modems de transmisión de datos. 


10,3 EL SOFTWARE 


En los inicios de la computación personal, el usuario dependía mucho de su 
propia habilidad como programador, y muchos de los programas utilizados en 
áreas técnicas y científicas eran creados por él mismo, o por los departamentos 
de informática de las organizaciones en que trabajaban. Lenguajes como Cobol, 
Fortran IV y Basic daban al usuario las herramientas para crear programas que 
servían para propósitos muy particulares. Estos programas, como el lector puede 
imaginar, no eran particularmente atractivos, ni diseñados pensando en la facili- 
dad de uso o aprendizaje. Sus aplicaciones eran muy específicas; su capacidad 
de presentación gráfica muy discreta, y su velocidad bastante baja. Hoy en día 
los llaman programas “green screen”, por los monitores monocromáticos verdes 
de entonces, y su presentación no muy atractiva, Evidentemente resulta fácil, ya 
a los finales del siglo, referirnos de forma jocosa o despreciativa acerca del esta- 
do de la ciencia de la computación 15 o 20 años atrás, pero tenemos que tomar 
en cuenta que lo que disfrutamos hoy no es más que los frutos cosechados de los 
desarrollos anteriores, y además, debemos tener presente que de la misma ma- 
nera, en dos décadas más probablemente consideraremos como ingenuo y primi- 
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tivo lo que actualmente nos satisface y nos sorprende en computación y en pro- 
gramación. 

En la medida en que los computadores se hacían más avanzados, los progra- 
mas se hacían a su vez más completos y complejos. Con el advenimiento de las 
nuevas PC con velocidades de procesamiento que antes sólo tenían las main- 
frames de las grandes universidades, ya no resulta práctica la creación de progra- 
mas propios. Los programas utilizados por las computadoras personales son 
creados por empresas que emplean a cientos de programadores, y su creación y 
desarrollo es una tarea de muchísimas horas-hombre. Además, han aparecido 
programas, como Lotus 1-2-3, o Excel, que permiten elaborar complejas itera- 
ciones, cálculos y procesamiento de datos, de una forma totalmente configurable 
por el usuario, con lo que éste aún cuenta con la posibilidad de crear sus propias 
aplicaciones, 


10.3.1 Sistemas operativos: DOS 


El software fundamental en un computador es el sistema operativo. Aun sin que 
el usuario lo sepa, apenas enciende el computador, ya está trabajando con un 
importante programa, que es el sistema operativo del computador. Si bien hay 
otros sistemas en el mercado, la inmensa mayoría de los computadores utiliza 
alguna de las versiones de Microsoft Disk Operatig System, o MS-DOS. La fun- 
ción de MS DOS es crear la plataforma básica de operaciones con la memoria, 
el disco duro, los periféricos instalados y establecer el lenguaje primordial de 
trabajo antes de correr ningún otro programa. 

MS DOS organiza la data, texto y programas en forma de directorios, subdi- 
rectorios y archivos. El usuario puede cambiarse entre capas o niveles sucesivos, 
listar en pantalla los distintos subdirectorios en que se encuentre, y correr pro- 
gramas utilizando comandos de DOS. El directorio principal se conoce como 
directorio raíz, o Root Directory; en él, la pantalla presenta el cursor con una 
letra “C” y un símbolo de prompt: (C:v>). que representa la unidad de disco 
duro. El usuario puede tener acceso a otra unidad de disco en lugar de C:; por 
ejemplo “A:” corresponde a la primera unidad de disquetes, “B:” corresponde a 
la segunda unidad de disquete. Los archivos pueden cambiarse entre una unidad 
y Otra, por medio de comandos de DOS. Las versiones más recientes de MS 
DOS tienen más de 120 comandos, y resulta conveniente para el usuario serio de 
computadores, familiarizarse con el uso de la mayoría. Con sólo tipear “HELP” 
en el cursor de DOS, aparecerá un detallado manual en pantalla que explica los 
comandos y su utilidad. 

La información está organizada en archivos, que son la unidad primaria de 
almacenamiento en el computador. Los archivos tienen un nombre, asignado por 
el usuario, y una extensión, que define el tipo de archivo; el nombre puede ser de 
hasta 3 caracteres y la extensión, definida por el programa, y separada por un 
punto, sólo tiene tres. Los archivos pueden estar organizados en el computador 
en subdirectorios, y éstos en directorios. La búsqueda de archivos se hace más 
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fácil si se mantiene un estricto orden con respecto a los subdirectorios y directo- 
rios en que se guardan. 

Todos los programas en el computador, incluyendo Windows, están en 
directorios de DOS, aunque la última versión de Windows (95), puede ser insta- 
lado en lugar de DOS, con lo cual lo sustituye. Esto debido a que Windows 95 
posee las herramientas suficientes para realizar todas las funciones de MS DOS. 


10.3.2 Windows 


Más que un programa, Windows —que en español quiere decir “ventanas”— es 
toda una plataforma o ambiente gráfico que cambia completamente el aspecto y 
la modalidad de trabajo en los computadores personales. Su origen está muy 
probablemente inspirado en la plataforma de trabajo que utilizó Apple en sus 
primeros computadores Macintosh, a inicios de los ochenta, y que enfatiza un 
uso intuitivo de las funciones del computador (user friendly), y una gran canti- 
dad de interacciones gráficas usando pequeños dibujos, o iconos, en lugar de 
instrucciones tipeadas, También fue Apple precursor en el uso del “ratón”, En 
Windows, el espacio de trabajo que aparece en la pantalla ha sido ingeniosa- 
mente diseñado como el símil de un escritorio; de hecho, se le llama “desktop”, 
que en inglés quiere decir “sobre el escritorio”. 

Sobre este “escritorio” están representados los programas y archivos 
mediante iconos, y éstos a su vez se hallan agrupados de acuerdo con su tipo, 
función, o simplemente de acuerdo con la configuración que el usuario escoja 
basado en su conveniencia. 

Cuando el usuario desea iniciar un programa o abrir un “documento”, sim- 
plemente señala el icono correspondiente con el mouse, o lo resalta con el tecla- 
do y lo escoge, con un botón del mouse o con la tecla enter. Cuando se corre un 
programa de aplicación, como un editor de textos, base de datos, un programa 
gráfico, o estadístico, Windows lo inicia, y el programa, con sus menús y 
comandos, aparece en un área del escritorio, de tamaño y posición configurable, 
llamada una ventana. Esta interfase gráfica es, sin embargo, sólo la punta del 
iceberg. Otra importante cualidad de Windows es la capacidad de que existan 
varias aplicaciones trabajando simultáneamente. Estas aplicaciones simultáneas 
pueden estar en diversas áreas de la pantalla, ocupando diversos espacios de ella, 
o en distintas “capas” o “niveles” de la pantalla. En este caso, en que la apli- 
cación utiliza todo el espacio disponible en la pantalla, puede haber otras aplica- 
ciones abiertas y funcionando en otras capas “debajo” de la actual. El usuario 
puede cambiarse entre una aplicación y otra con un simple comando (pulsando 
las teclas ALT + TAB; o las teclas CTRL + ESC). Esta capacidad de Windows 
está limiteda, naturalmente, por la memoria disponible por el computador, así 
como por el tamaño de las aplicaciones que deseen abrirse simultáneamente. 

Otra interesante cualidad de los programas que se han diseñado para traba- 
jar en ambiente Windows es la facilidad con que pueden intercambiar gráficos, 
textos, y documentos entre aplicaciones. Comandos de tipo “Cortar y Pegar” 
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permiten seleccionar la información que se quiere transferir a otra aplicación; e 
instrucciones de linking (enlace), permiten que la información, al ser actualizada 
en la aplicación original, se actualice automáticamente en todas las aplicaciones 
en que se ha transferido; por ejemplo, suponga que en una aplicación hay un 
conjunto de datos, y éstos son transferidos mediante un enlace de datos con otra 
aplicación que los tabule, los utilice para realizar algunos cálculos y construya 
un gráfico con los resultados; pues bien, si así lo desea el usuario, con sólo cam- 
biar un número en la aplicación original, tanto los cálculos como el gráfico se 
recalcularán y se trazarán con los nuevos resultados. 

Windows es una plataforma de trabajo que otorga al usuario fundamental- 
mente una gran versatilidad y facilidad de uso. Una de las razones por las que se 
ha globalizado el uso de este programa/plataforma, es que las empresas fabri- 
cantes de software han construido sus productos para trabajar bajo Windows, lo 
que ha hecho que virtualmente toda computadora personal hoy en día tiene algu- 
na de las versiones de Windows.? 


10.3.3 Programas especializados 


Existe una gran variedad de programas de software que forman parte de las herra- 
mientas que se utilizan en el área de la investigación de mercado. En esta sección 
nos dedicaremos a mencionar tres de ellos: Raosoft Survey, Quantime y SPSS. 


Raosoft Survey: Raosoft Survey de Raosoft, Inc. es un programa que ayuda en la 
recopilación de datos para una encuesta. Este programa está disponible tanto 
para trabajar en DOS como en ambiente Windows. Raosoft Survey puede uti- 
lizarse desde para editar el cuestionario hasta para hacer análisis y reportes. 

Una de las características de Raosoft Survey es que es compatible con la 
mayoría de los procesadores de texto, hojas electrónicas y bases de datos; 
además, tiene un acceso directo a dBase III. Por ejemplo, uno puede editar en 
Word y llevar nuestro cuestionario al editor de Raosoft Survey o importar una 
base de datos (como Excel, Lotus, etcétera) a la base de datos de Raosoft Survey. 

Utilizando el editor de Raosoft Survey se pueden construir preguntas como: 


+ Sí/No. 
+ Opción múltiple (sólo una respuesta). 

+ Opción múltiple (más de una respuesta). 

+ Grados de oprobación/percepción. 

+ Preguntas que dependen de las respuestas a otras preguntas (skip). 
+ Preguntas abiertas (texto y numéricos hasta 240 caracteres). 

+ Range questions. 


3 Con excepción de los computadores Apple, que cuentan con su propia plataforma de 
trabajo tipo Windows, de diseño propio. 
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+ Weighted score. 
+ Comentarios (hasta 240 caracteres). 


Una de las ventajas que ofrece Raosoft Survey es que se puede combinar 
correspondencia, es decir que de los nombres y datos personales se puede hacer 
un listado y mandar correspondencia de, por ejemplo, agradecimiento, a todas 
las personas que participaron en la encuesta. 

Con este programa se pueden monitorear ciertos planes que implemente la 
empresa, hacer un seguimiento, una auditoría o un pronóstico de ventas, así 
como también hacer revisiones internas, como el entrenamiento de los emplea- 
dos, o hacer encuestas de opinión entre ejlos. También se puede hacer investi- 
gación de mercado mediante una encuesta con los clientes, etcétera. 

Los datos en Raosoft Survey se pueden guardar en formato ASCII para 
después ser analizados con más detalles, por ejemplo con SPSS. 


Raosoft, Inc. 

6645 NE Sindermer Rd 

Seattle, Washington 98115 

Tel: (206) 525-4025 Fax (206) 525-4947 


Quantime. Este programa está diseñado para empresas que se especializan en la 
investigación de mercado y requieren de equipo de computación y programas 
más sofisticados para desarrollar su trabajo. El software de Quantime está com- 
puesto de diferentes módulos (que se adquieren por separado) para formar 
Quantime System: 


+ Quanquest para el diseño de cuestionarios. 

+ Quinput para captura de datos. 

+ Quancept para CATI (Computer Aided Telephone Interviewing). 
+ QTS (Quantime Telephony System) para entrevistas por teléfono, 
+ Quancept para CAPI (Computer Aided Personal Interviewing). 

+ Quantum para Tabulación/Edición. 

+ Quanvert para Análisis de datos. 


Quantime Telephony System (QTS) es un sistema integrado por hardware y 
software que combinado con Quancept incrementa la productividad en las entre- 
vistas telefónicas. QTS tiene un sistema de marcación automático y registro del 
resultado de la llamada. 

Quanquest sirve para diseñar y editar el cuestionario. Si así se desea, se 
puede importar hacia Quanquest o viceversa desde cualquier otro editor de texto. 
El editor cuenta con comandos de cortar y pegar, borrar, insertar, mover, etcétera. 

Quinput es un programa de captura de datos. Es versátil y fácil de usar, este 
programa corre en cualquier computadora en DOS o en cualquier computadora 
386 bajo XENIX, y también bajo Windows. 

Utilizando Quinput el supervisor puede regular la estructura y calidad de los 
datos en el momento en que se introducen; Quinput está diseñado pensando no 
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sólo en las funciones del supervisor sino en las del operador, por lo que se reú- 
nen las mejores condiciones para una rápida captura de datos. 


Quancept CAPI/CATI. Este módulo permite que los encuestadores de campo 
utilicen computadores personales (notebooks) empleando únicamente 512K de 
memoria y facilita después reunir sus encuestas con los datos recopilados en 
CATI obteniendo así un procesamiento de los datos más fácil y eficaz. 

Para hacer más entendible este módulo, debemos saber que la diferencia 
entre CATI y CAPI consiste en que CATI es para entrevistas telefónicas, mien- 
tras que CAPI es para el trabajo en el campo. Si por ejemplo un estudio requiere 
que las entrevistas se realicen tanto telefónicamente como casa a casa e intercep- 
tando a la gente que sale de comprar de un supermercado, la combinación de 
estos resultados es mucho muy sencilla usando el módulo Quancept. 

Los requerimientos de sistema para utilizar Quancept CAPI es cualquier 
computadora que tenga al menos 512K de memoria. Para CAPI los requerimien- 
tos son mayores. Es recomendable que se tenga una red de computadoras para 
facilitar el trabajo. 

Con Quancept CATI el entrevistador dispone de una gran ayuda, ya que 
puede controlar las cuotas y codificar las respuestas abiertas, así como hacer 
algunas tabulaciones para saber en qué estado se encuentra el estudio. De esta 
forma se puede determinar cuál es el rumbo que lleva la encuesta. Además, si la 
entrevista es interrumpida por alguna razón, e! sistema de Quancept CATI puede 
volver a hacer la llamada y continuar en el punto donde se interrumpió la 
encuesta con todas las respuestas anteriores completamente salvadas de manera 
que no haya pérdida de tiempo. 

Quancept CAPI además determina la duración de la entrevista y la tasa de 
incidencia, por lo que el supervisor puede estimar mejor los costos que implica 
el desarrollo del estudio. 

Como en Quancept CATI puede actualizar los resultados continuamente, 
esto ayuda al supervisor a entregar resultados preliminares al cliente. Otra 
caraterística de Quancept CATI es que se puede monitorear a cualquier entrevis- 
tador y escuchar su conversación, lo cual es muy útil tanto para entrenar entre- 
vistadores como para evaluar su desempeño. CATI corre en estaciones de 
trabajo y servidores Sun bajo solaris o en estaciones HP bajo HP/UX y Scounix, 
Novell, Dos, Windows. 


Quantum: Quantum puede manejar una encuesta de cualquier tamaño y de 
Cualquier tipo. Quantum proporciona cualquier tipo de tabla y sin recalcular los 
datos puede construir tablas desde las gráficas, es decir si se tiene una gráfica de 
barras y los datos se quieren ver en una tabla, Quantum lo puede hacer de una 
manera muy rápida. También se puede juntar información en cualquier forma 
específica que se desee; se puede regular la posición exacta de cada parte, el 
espaciado y el tipo de fuente (letra). 

Se puede exportarfimportar entre Quantum y cualquier hoja de cálculo 
(spreadsheet); por ejemplo de Excel a un procesador de texto, a Word o a paque- 
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tes de gráficos como Harvard Graphics, así como exportar datos y variables a 
SPSS para hacer un análisis más detallado. 


Quanvert. En aquellos casos en que el usuario quisiera más datos de los que con- 
tiene un reporte, nuevas variables, nuevas tablas o seleccionar algunos datos 
para otros propósitos... Quanvert puede manejar estos datos en segundos. 

Con sólo algunos simples comandos de programación se puede traducir de 
la base de datos de Quantum a una base de datos inddependiente en Quanvert. 
Nuevas tablas o variables se pueden crear en segundos, también se pueden 
imprimir los resultados con porcentajes y otras opciones, así como también se 
puede crear una base de datos para combinar correspondencia y también expor- 
tar datos a programas tales como Lotus 1-2-3, SPSS, Symphony. 


Quantime Corp. 

11 East 26th Street, 16th Floor 

New York, NY 10010 

Tel: (212) 447-5300 Fax: (212) 447-9097 


SPSS (Statistical Package for the Social Sciences): 


SPSS es un programa especializado en estudios sociales y mercadotécnicos. SPSS es 
un paquete muy conocido, porque desde que fueron utilizadas las computadoras 
electrónicas en los años sesenta, este programa fue introducido para análisis 
estadísticos en el campo de los estudios sociales. Al introducir las minicompu- 
tadoras, al principio de los setenta, SPSS fue adaptado y utilizado en un nivel 
más amplio por los investigadores del mercado. Hasta la fecha con los avances 
tecnológicos de las computadoras, SPSS ha tenido un crecimiento tal que en estos 
momentos existe SPSS para Windows 98, 99. Además, cada año sale una nueva 
edición de SPSS. Utilizando el SPSS uno puede realizar entrevistas directamente 
en el computador (CATI) donde simukáneamente uno hace la entrevista y cap- 
tura los datos. 

También SPSS sirve para la tabulación de los datos, Crosstabs £ Multiple 
Crosstabs (Bannertab), gráficas y preparación de reporte. Al mismo tiempo, este 
programa es capaz de conducir análisis estadísticos más avanzados de variables 
múltiples, segmentarios, cluster analysis, mapear y más. 

Es importante que el lector y los alumnos recuerden que el 90% de los estu- 
dios sociales y estudios de mercado hechos a nivel mundial requieren tabulación 
y un breve reporte (top-line report). Actualmente vivimos en una era de mucha 
rapidez, donde todos los aspectos de la vida tienen que adaptarse con esta forma 
de pensamiento. 
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Por tanto, el integrar los resultados de una investigación, en el más breve tiem- 
po posible es lo más importante para tomadores de decisiones oportunas, como 
mercadólogos, publicistas, ingenieros de producción y diseñadores de servicio. 
Por esta razón se han ido desarrollando numerosos paquetes de tabulación mucho 
más versátiles, fáciles de utilizar y con más potencial que SPSS, ejemplo de ello es 
Wineross, producto de la compañía The Anathical Group, un paquete muy podero- 
so para hacer múltiples tabulaciones (Bannertab)*. 

Para informar más acerca de los diferentes paquetes estadísticos que hoy 
en día hay en el mercado y respecto a las potencialidades de cada uno, refiéra- 
se a WWW.AA.Org/Marketing News April 26,1999. 


10.4 GUÍA PARA LA PERFORACIÓN DE DATOS 


Para concluir el tema de las tarjetas de perforación, se deben hacer unas sugeren- 
cias. Estas aparecen en muchos manuales del procesamiento de datos.4 


1. Utilizar el esquema de codificación “natural”. Los dígitos deben seguir 
un orden conocido, por ejemplo, a los que marcan respuestas positivas u 
optimistas, se le asignan números altos; a otras respuestas como nunca, 
una vez, dos veces, hay que asignar los números 1, 2 y 3 en lugar de 3, 2 
y 1. Para los items (preguntas) que no tienen ningún orden, es aconsejable 
usar dígitos para las respuestas más frecuentes. 

2. Evitar el uso de espacios blancos como una categoría de codificación. 
Muchos programas de cómputo no pueden distinguir entre un espacio 
blanco y el cero, por lo tanto, van a interpretar un espacio blanco como 
cero. Sin embargo, el cero es un dígito válido y frecuentemente se utiliza 
para representar a los que no respondieron, entonces se usa como “no 
respuesta”, “no información”, etc. 

3. No perforar los signos “—”, “+”, En el procesamiento de datos no cono- 
cen o reconocen estos signos como categoría de codificación. 

4, Utilizar sólo una perforación en cada columna. Alguna vez se permite a 
los entrevistados dar más de una respuesta a ciertos items, parece razona- 
ble perforar todas sus respuestas en una sola columna, pero esto complica 
el procesamiento de datos, por no saber cuál de los varios números mar- 
cados se deben considerar. 


10,4.1 Hoja de codificación 


No todo tipo de datos permite la perforación directa, por lo que se deben regis- 
trar las informaciones en una “hoja de perforación” y después se entrega al per- 
forista. Dichas hojas se usan comúnmente para registrar datos secundarios, y a 
veces se usan para registrar datos primarios (cuestionarios) también. Por lo gene- 


4 Janda, Kenneth, Data Processing: Aplications 10 Political Research (Evanston, Ulinois: 
Northwestern University Press, 1965). 
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ral, los cuestionarios tienen su hoja de codificación o están codificados en el mis- 
mo cuestionario y después de la verificación se deben entregar al perforista. Por 
lo general, la hoja de codificación (figura 10.4) tiene el mismo formato que la tarje- 
ta de perforación. Usualmente tiene 25 líneas y cada una representa a una tarjeta. 
En esta hoja se registran los datos, de manera que cada renglón represente un 
caso y cada columna un item (pregunta). Igual que en la tarjeta de perforación se 
pueden dedicar las primeras 5 o 10 columnas para identificación y control. 


10.4.2 Verificación de datos 


Lo primero que un investigador hace después que los encuestadores terminan 
el trabajo de campo es verificar los cuestionarios. Esto consiste esencialmente en 
localizar los cuestionarios que se contestaron incorrectamente, ilegibles, incom- 
pletos o inconsistentes. Muchos investigadores hacen esta verificación durante 
el trabajo de campo, para la posible corrección y control de los errores. De cual- 
quier forma se deben verificar los cuestionarios antes de codificar. 

A continuación se presentan los errores más comunes: 


+ Respuestas ilegibles. Es muy común en las entrevistas personales que no 
tienen supervisión, y este tipo de respuestas es frecuente en los cuestiona- 
rios que tienen muchas preguntas abiertas. 

+ Respuestas incompletas. Es muy usual que muchos cuestionarios no ten- 
gan respuestas para ciertas preguntas. 

* Respuestas inconsistentes, Á veces, con una simple mirada el investigador 
puede descubrir tales respuestas, como por ejemplo, es aficionado al de- 
porte pero no practica ninguno, usa algún método anticonceptivo pero no 
conoce DIU o la píldora, etc. Los entrevistados pueden no contestar varias 
preguntas por falta de interés u otros motivos. 


10.4.3 ¿Qué hacer con las respuestas no válidas? 


No se puede evitar, siempre hay malas respuestas en las entrevistas personales y 
dependiendo de cómo se elaboró el cuestionario y cómo se realizó la entrevista, 
el porcentaje de las respuestas puede variar (respuestas no válidas). Pero la pre- 
gunta que surge inmediatamente es ¿qué hacer con estas preguntas? Tomar una 
decisión apropiada respecto a las respuestas no válidas, depende básicamente del 
porcentaje de preguntas buenas (válidas). 

Cuando hay un alto porcentaje de respuestas válidas, se pueden ignorar las 
respuestas no válidas (malas); pero al contrario, cuando un alto porcentaje de res- 
puestas son no válidas (malas) y se necesitan más datos para el propósito de aná- 
lisis para proyectibilidad y llegar a conclusiones confiables, se debe encontrar 
alguna manera de corregir las fallas (malas respuestas). Por lo general, kay tres 
formas de corregirlas. 
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* Recopilar mejor información. Es posible, suponiendo que se puede identi- 
ficar al entrevistado, regresar y tratar de obtener las respuestas correctas 
a la pregunta. Este método es caro y difícil en los estudios en que el 
tamaño de muestreo es grande; además, hay que recordar que recopi- 
lar datos por segunda vez no será igual que la primera vez, por dos ra- 
zones: 


a) Cambios que pueden ocurrir durante ese lapso. 
b) En la segunda vez el propósito de recopilar datos cambiará, y éste 
puede influir en el entrevistado. 


* Usarlos tal como se reciben, Es posible usar los datos tal como se reciben, 
pero en la tabulación de datos se puede dar otra categoría a los que no 
respondieron a algunas preguntas, o a las respuestas inconsistentes. Este 
método es muy común, pero al aplicar estadísticas avanzadas (multiva- 
riadas) causará dificultades. 

+ Ignorar totalmente las respuestas no válidas. El método más simple y sen- 
cillo es ignorar las respuestas no válidas (malas). Cuando el muestreo es 
grande y el porcentaje de respuestas no válidas es pequeño, se puede usar 
este método. Este método no es muy común por ciertas razones: 


a) Las malas respuestas pueden significar algo que sirviera en la con- 
clusión y comparación de datos. 

b) Eliminar los datos no válidos puede crear sesgo en el resultado, espe- 
cialmente en las preguntas inconsistentes, puede influir el investigador 
al verificarlos. 

c) Finalmente hay que considerar el costo y tiempo que se dedica a recopi- 
lar los datos. 


10,5 EL PROCESO DE CODIFICAR 


Tal vez, lo primero que se debería hacer después de diseñar todos los códigos es 
hacer una segunda pequeña muestra de cuestionarios completos y probar los 
nuevos códigos. Después de hacer cualquier corrección necesaria a los códigos, 
puede que ahora sean finalmente mecanografiados o duplicados y, donde sea 
necesario, reunirlos en un libro de códigos que se distribuirá a cada codificador 
junto con instrucciones de código. Las instrucciones del código deberían remitir 
algunos principios generales, tales como la forma para aclarar dudas, el sistema 
de numeración, el método de codificar preguntas de respuesta múltiple, y aun 
detalles como tipo y color de pluma o lápiz que se usará. En grandes organiza- 
ciones de investigación puede haber un departamento separado de codificación, 
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tal vez, con varias investigaciones al mismo tiempo y obviamente algunos arre- 
glos jerárquicos que deben hacerse para regular las diferentes responsabilidades 
y el flujo de trabajo. 

En particular, debería haber un procedimiento estándar para no perder de 
vista cada cuestionario desde el momento que llega a la sección de codificación. 
porque es muy fácil que los cuestionarios se pierdan, y pueden convertirse en 
casos dudosos, o confundirse con otro grupo de cuestionarios de otra investiga- 
ción. Es mejor dejar a cada codificador trabajar sobre cada cuestionario, pasando 
de pregunta en pregunta y de código en código hasta que llegue a la página final 
porque así él obtiene una imagen completa del entrevistado y puede verificar 
cualquier aparente inconsistencia. 

Sin embargo, algunas veces puede que exista una buena razón para distribuir 
una pregunta o un grupo de preguntas a un codificador particular, quien codifi- 
Cará estas preguntas nada más. Por ejemplo, puede que esto suceda si se usa un 
código socioeconómico elaborado particularmente, ahorra tiempo y se reducen 
inconsistencias si un codificador llega a conocer el código y no codifica otras 
preguntas, 

Suponga ahora que el codificador ha leído una respuesta, ha estudiado el 
código, y ha decidido a qué categoría corresponde la respuesta, ¿cómo debería 
indicar esta clasificación? 

Existen sólo dos posibilidades, cada una con sus variaciones: El codificador 
pondrá el número indicando la clasificación, ya sea en el cuestionario mismo, o 
en una hoja de papel separada, usualmente conocida como hoja para perforar. 
Para decidir cuál es más apropiada en una investigación, se debe considerar la 
proporción de preguntas con respuesta abierta y el trabajo de los operadores 
perforistas quienes pondrán la información de la cita en tarjetas perforadas. Los 
operarios perforistas trabajarán más rápido y con el mínimo de errores cuando 
puedan trabajar más o menos automáticamente. Cualquier distracción, tal como 
letras legibles, anotaciones, muchas páginas por cambiar, romperán el ritmo de 
su trabajo y causarán demoras y costos altos. Desde el punto de vista de los ope- 
rarios, las hojas perforadas son ideales. Ellos nunca ven los cuestionarios origina- 
les, no hay texto que leer, páginas a las que hay que dar vuelta, sólo largas filas 
de letras que perforar, y una sencilla revisión al final de cada frase. Una hoja 
perforada puede consistir en una hoja o un juego de hojas de papel cuadricula- 
do con las variables a través de la parte superior y el número de casos abajo, co- 
mo se ilustra en la tabla 10.1. 

Cada pregunta tiene su propia columna o columnas o su propia variable (en 
el caso de análisis por computadora), y en los primeros lugares se colocan los nú- 
meros de casos. El trabajo del codificador es llenar todas las entradas para cada 
caso; el trabajo del perforista es el de perforar cada fila de la hoja perforada en 
tarjetas o grabar en cinta. Si el cuestionario requiere de más de 80 columnas, se 
empieza una segunda hoja perforada para cada caso y así en lo sucesivo. Es muy 
importante que no se dejen espacios en una hoja perforada a menos que el espa- 
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Tabla 10.1 


PI Pla Plb P3 P4 P3a PSb  P5c 
6 7 8 9 10 1 1243 Ífetc. 


Caso 

Números: 
62700 
62701 
62702 
62703 
eto. 


cio en blanco tenga un significado específico en esa columna; la hoja perforada 
no deberá pasarse a los perforistas hasta que se hayan aclarado todas las dudas. 

Como se indicó, este procedimiento es ideal desde el punto de vista de los 
perforistas, pero ¿cómo afecta esto a los codificadores? Esto dependerá en gran 
parte del número de preguntas cerradas o precodificadas en la investigación. Si 
la investigación consiste solamente de preguntas precodificadas, entonces es inútil 
tener las respuestas copiadas especialmente en hojas perforadas, y en cualquier 
caso no se requerirá ninguna codificación, por lo que después de verificar los 
cuestionarios completos se envían directamente a la sección de perforación y 
ésta se hará directamente de los cuestionarios originales. 

Si sólo una parte de las preguntas son de respuesta abierta, mientras que la 
mayor parte son precodificadas, entonces los codificadores están instruidos para 
poner las entradas de código directamente en el cuestionario, quizá en el margen 
derecho alineado con la respuesta escrita, Los perforistas entonces perforarán las 
preguntas precodificadas e insertarán las entradas de código donde ellas apa- 
rezcan. Si en la investigación hay grandes números de preguntas con respuesta 
abierta, entonces la decisión de si se perforarán las hojas o no se vuelve más di- 
fícil, puesto que su uso implica que el codificador ponga sus entradas de código 
en el lugar correcto de la hoja perforada (en vez de ponerlas en el margen del 
cuestionario), pero también en el copiado de las respuestas precodificadas en las 
hojas perforadas, lo que es una operación tediosa, que puede causar errores. Si 
se decide no usar una hoja perforada en estas circunstancias, entonces sería con- 
veniente tomar esto en cuenta en el arreglo del cuestionario. De otra manera, los 
perforistas tendrán que buscar en un laberinto de cuestionarios impresos para po- 
der recopilar precódigos circulados o comprobados, entremezclados con las ano- 
taciones hechas por los codificadores. 

Un plan bien trazado, por ejempto, al tener todos los precódigos abajo del 
lado derecho, puede hacer más fácil este trabajo, más rápido, y sobre todo más 
preciso. También es importante revisar todos los cuestionarios cuando llegan, 
especialmente si los Henaron los entrevistados y no los entrevistadores, para ase- 
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gurarse de que no hay pregunta sin contestar. Ocasionalmente, cuando el tiempo 
apremia, puede que sea mejor perforar dos veces los cuestionarios: una vez para 
perforar sólo las respuestas abiertas; las máquinas pueden reunir los dos juegos de 
información, en forma subsecuente, si así se desea, por lo que ambos juegos ten- 
drán el número de identificación de cada caso. Se puede enfatizar que usan los 
números de identificación de caso para fines de clasificación. Suponga, por ejem- 
plo, que se tiene una muestra de niños seleccionados de escuelas, se puede decidir 
dar a cada niño un número de seis cifras: el primer dígito para indicar el sexo 
(Lo 2, significando niño o niña); el segundo dígito para indicar distrito o área 
(suponiendo que no hay más de 9 distritos representados en nuestra muestra); el 
tercer dígito indicará la escuela a la que el niño asiste (suponiendo que no hay 
más de 9 escuelas en cada distrito); el cuarto dígito se puede usar para indicar el 
grado o nivel dentro de la escuela particular; y los dos últimos dígitos identifica- 
rán al niño por el número de lista en su clase. Por lo tanto, el caso número 279513 
significará, una niña en el quinto grado en la escuela 9 del distrito 7, identífica- 
ble como el número 13 en la lista de nombres en su clase. Asimismo, se puede 
reunir rápidamente a todos los estudiantes del tercer grado o a todos los niños 
del distrito 4, o a todos los alumnos de la escuela 81 (significando escuela 1 en 
distrito 8). 

En la mayoría de las operaciones de codificación los primeros 100 casos 
serán los más lentos y tendrán una gran proporción de dudas. Los codificado- 
res por más que hayan abreviado cuidadosamente y por más que hayan elabora- 
do los códigos en forma tan explícita como les fue posible, inevitablemente dife- 
rirán en su codificación de respuestas certeras, y puede que también sean dé- 
biles en el cuadro de codificación. Por lo tanto, desde el principio, se debe orga- 
nizar un procedimiento para aclarar las dudas, un procedimiento para discusiones 
de casos difíciles, un procedimiento para corregir los códigos o establecer reglas 
especiales y un procedimiento para comprobación. En cualquiera, pero sobre to- 
do en las investigaciones más pequeñas, deberían tener un supervisor de código, 
quien tendría que organizar e implementar estos procedimientos, para hacer al- 
gunos de los códigos, para comprobar, y decidir sí o no corregirá el código. Cuando 
se trató la categoría de “varios”, se vio que corregir un código es algo que no se 
puede hacer a la ligera, porque es necesario recodificar. Al resistir la tentación de 
acortar categorías y clasificar tas respuestas dudosas bajo “varios” se puede redu- 
cir el trabajo de recodificarlo, en una etapa posterior: se decidiría hacer una 
nueva categoría para alguno de los casos que hasta aquí se clasificaron como varios. 

En cualquier caso, es siempre mejor conservar el significado de cada cate- 
goría tan claro como sea posible; esto reducirá dudas cuando se interpretan los 
resultados. 

El codificador no tendría problemas si, durante la investigación, se 
mantienen consistencias certeras al diseñar los códigos. Por ejemplo, puede que 
se decida siempre codificar “varios” u “otros” como categoría 9, “sin respuesta” 
como categoría O y así en adelante. Si se usan clasificaciones, se debería tratas 
de hacerlas de manera que sigan la misma dirección de positivo o negativo. 
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Una clave útil en el proceso de codificación es la instrucción “registrar”, en 
el caso de preguntas certeras. La instrucción significa que el codificador va a 
copiar literalmente lo que el entrevistado o el entrevistador ha escrito, junto con 
el número de identificación del caso. Por ejemplo, en un estudio de elección, pue- 
de que se pida a los codificadores “registrar” cualquier referencia al partido co- 
munista, para estudiar su forma de ser más de cerca. Algunas veces puede que se 
dé esta instrucción porque se desea profundizar en un número selecto de casos o 
para usar sus respuestas como citas ilustrativas en nuestro reporte. 


Códigos de mención múltiples 


Se ha mencionado muchas veces al código de mención múltiple, esto es una 
solución al problema que se suscita cuando el entrevistado da o se le dice que dé 
más de una respuesta a una pregunta. Suponga que se ha preguntado: “¿Qué es 
lo que más a menudo hace usted en su tiempo libre?”, suponga entonces que se 
ha desarrollado un amplio juego de 9 categorías, se puede decidir arbitrariamente 
el distribuir, por ejemplo, 3 columnas de una tarjeta para perforación a esta pre- 
gunta, cada una por la primera, segunda y tercera respuestas. Puede que aún se 
desee suponer que el orden de las respuestas indica la importancia que tiene para 
el entrevistado, por lo que la primera columna contendrá las respuestas más im- 
portantes. 

Se tendrán que ignorar las cuartas respuestas y también las siguientes, 
para afrontar el problema que no todos han dado tres respuestas, o aun 
dos. Más aún, cuando el análisis estadístico se efectúe, se tendrá que tratar cada 
juego de respuestas en forma independiente y puesto que la distribución de fre- 
cuencia de la primera respuesta puede ser muy diferente de la segunda y tercera 
respuestas. ¿Cómo se van a interpretar estos resultados? En preguntas como éstas 
sería mejor tener un estilo diferente, por ejemplo: “¿Cuáles son las tres cosas 
que usted disfruta más haciéndolas en su tiempo libre? Por favor, dígamelas en 
orden de importancia”. Ahora que está seguro de que los entrevistados van a dar 
el mismo número de respuestas, se ha descartado la posibilidad de cuartas y quin- 
tas respuestas, y se puede estar seguro de que la primera respuesta es realmente 
la más importante. Además, si se encuentra que la distribución de frecuencias, 
difiere de las otras dos, se puede usar su importancia relativa, por ejemplo, de 
que la fotografía usualmente tiene primer lugar entre hombres de clase media, 
mientras que los hombres de la clase trabajadora sólo mencionan a la fotografía 
como una segunda o tercera elección. 

Sin embargo, hay otra solución a este problema, que puede aplicarse cuan- 
do la redacción de la pregunta en la forma antes mencionada no es cómoda o 
forzaría demasiado a las respuestas. Considérese otra vez el ejemplo dado de la 
investigación para lectura de estudiantes, concerniente a los diferentes sistemas 
usados al leer un libro de texto en la biblioteca. Se puede ver que muchos estu- 
diantes usan más de un sistema al trabajar en el mismo libro. ¿Qué ocurriría si se 
codifican estas respuestas en la misma columna? Técnicamente hablando no ha- 
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bría ninguna dificultad en el caso de análisis con tarjetas perforadas, puesto que 
es posible hacer más de 12 perforaciones en la misma columna, y puesto 
que las máquinas pueden producir distribuciones de frecuencia para cada posi- 
ción en cada columna. La única dificultad que puede suscitarse es el problema de 
la clasificación: Si se desea clasificar a los entrevistados dentro de una docena 
de grupos grandes de acuerdo con sus sistemas de lectura, ¿cómo clasificaría a un 
entrevistado si ha usado más de un sistema? Tal vez, puede clasificarse primero 
con aquellos que han usado su primer sistema, y entonces es muy tedioso. Por 
esta razón, los códigos de mención múltiple se evitarán para preguntas que serán 
usadas para agrupar a los entrevistados en sus muestras. Desde el punto de vista 
estadístico, se debe encontrar cómo afrontar el problema de tener más respues- 
tas que entrevistados. No hay dificultades al tabular tal información y sacar por- 
centajes, aun cuando tales porcentajes sumaran más del 100%, De igual manera, 
si se desea estudiar diferencias de grupo se pueden comparar tales porcentajes, pero 
el problema de fijar la significancia estadística presenta una gran dificultad debi- 
do a que la información no es independiente. 

Suponga que se ha obtenido en el ejemplo anterior, la información contenida 
en la tabla 10.2 Para doscientos hombres estudiantes y 50 mujeres estudiantes, 

Puede que se piense aumentar la pregunta general: ¿están relacionados los 
sistemas de lectura con el sexo del entrevistado? Sin embargo, esto requeriría 
calcular una prueba de 12 X 12 de significancia de las frecuencias sin porcentuar, 
de las cuales se derivan estos porcentajes y esto no es posible, puesto que, supo- 
ne que las entradas en las celdas son independientes, y esta suposición no es jus- 
tíficable cuando más de una respuesta viene del mismo individuo. Sin embargo, 
lo que se puede hacer es probar cada categoría contra todas las otras juntas, en 
una serie de pruebas de 2 X 2 Ji-cuadrada de significancia. Si se observan otra vez 
los porcentajes se nota una diferencia sustancial de sexo en la categoría 2 (“leer 


Tabla 10.2 
Hombres Mujeres 
(WN = 200) (W = 50) 

Y Nosabe, sin respuesta 8% 8% 

X Varios 10 8 

0 Encabezados de capítulos 11 14 

Í Examen superficial, capítulo por capítulo 

haciendo notas 18 16 

2 Leer portada por portada 10 36 

3 Leer superficialmente y hacer notas 25 30 

4  Concentrarse en una sección solamente 3 12 

5 Usaríndice 30 30 

6 Leer los resúmenes de los capítulos 3 2 

7 Sólo leer conclusiones 33 34 

8 Introducción solamente 10 10 

9 Leer varias secciones a fondo 10 14 


EL PROCESO DE CODIFICAR 279 


portada por portada”): 10% de hombres contra 36% de mujeres (o, en frecuencias 
sin porcentuar: 20 de 200 hombres y 18 de 50 mujeres). Ahora se puede probar a 
todos los que respondieron en términos de la categoría 2 contra los que no lo 
hicieron (todos los que no tienen dos respuestas) 180 hombres y 32 mujeres, con 
la ayuda de una prueba ordinaria de 2 X 2 Ji-cuadrada. Esto reduce el problema 
de falta de independencia y motiva al entrevistado a dar tantas respuestas como 
él quiera, lo que se puede codificar y usar, y no hace suponer nada acerca de su 
importancia relativa para el entrevistado. Obsérvese que las pruebas de Ji-cuadra- 
da se hacen en el número total de casos en cada muestra, no en el número total 
de respuestas; esto, entonces, es una forma en la cual podemos identificarnos con 
el análisis estadístico de códigos de mención múltiple, 


CAPÍTULO 


11 


Análisis de datos 


11.1 INTRODUCCIÓN 


El análisis de datos es la manipulación de hechos y números para lograr ciertas 
informaciones en una técnica que ayudará al administrador a tomar una decisión 
apropiada. La idea principal de cualquier estudio es lograr cierta información 
válida y confiable. Cuando se llevaba la materia de estadística, se vieron varias 
técnicas para manipular los datos y tal vez uno se preguntaba para qué sirven 
estas técnicas. 

El objetivo de este capítulo es mostrar la importancia de la estadística en 
una investigación, entenderemos al presentar las técnicas más utilizadas, su 
interpretación y la razón de su uso. 

Este capítulo empieza con la estadística descriptiva, análisis de varianza, 
medios de asociación y regresión. La estadística no paramétrica y paramétrica para 
probar hipótesis y la estadística multivariada se explican en el siguiente capítulo. 


112 OBJETIVOS DE ANÁLISIS DE DATOS 


Básicamente un investigador tiene siete objetivos generales cuando se trata de 
analizar los datos.! 


+ ¿Qué hay en los datos? 
+ ¿Qué tanto varían los datos? 


I Greenberg, Barnett; Goldstucker, Jack, y Bellenger, Danny, What Techniques are used by 
Marketing Researcher in Business, Journal of Marketing, abril, 1977, pp. 62-68. 
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+ ¿Cómo están distribuidos los datos? 

+ ¿Qué relación existe entre las variables? 

+ ¿Qué estimaciones y predicciones resultarán de los datos? 
+ ¿Qué diferencia existe entre grupos y variables? 

+ ¿Qué variables causan variación en otras? 


Las estadísticas que se usan para llegar a los objetivos citados arriba se indi- 
can en la tabla 11.1. 


Tabla 11.1 

Objetivo de análisis Técnicas estadísticas para análisis 

Qué hay en los datos. — Media, mediana, moda. 

Qué tanto varían los datos, — Desviación estándar, rango, varianza 
y desviación promedio. 

Cómo están distribuidos. — Frecuencia. 

Qué relación existe, — Correlación y medidas de asociación. 

Hacer estimación y predicción — Estimación de punto e intervalor. 
Regresión y serie de tiempo. 

Describir las diferencias entre grupos — Prueba de 7, Z y análisis de varianza. 

y variables 

Demostrar causalidad. — Prueba de T, Z y análisis de varianza 


El investigador casi siempre aplica estas técnicas con ayuda de cómputo. A 
menos que tenga muy pocos datos y tenga el interés de realizar análisis simple. 
El investigador no debe ser experto en programación sino simplemente saber 
cómo usar los datos estadísticos SPSS. (The Statistical Package for the Social 
Sciences.) 


11,2.1 Media 


Media es la suma de los valores de toda la observación divididos entre el 
número de observaciones, La media se puede obtener sólo con los datos métri- 
cos, datos que estén en escalas intervalares o proporcionales Por ejemplo, las 
unidades de producción de 10 plantas por día son, 62, 72, 27, 34, 35, 68, 112, 
72, 0 y 58. 

Se puede calcular la media aplicando la fórmula. 


(11) 
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= número de observaciones. 


540 


So =54 


Cuando se tiene que calcular la media de una distribución de frecuencia, se 
puede calcular usando la fórmula 


N 
X=) fX (112) 
donde: 


y $ ¡Xi = La suma total de todas las categorías multiplicadas por su correspon- 
diente frecuencia. 


Ejemplo 

La tabla 11.2 presenta los años de escolaridad de un muestreo de 34 trabajadores. 
La media de la educación de los trabajadores se puede calcular usando la fórmula 
(11.2) calculando el valor de > fi X ¿ (la multiplicación de la columna uno por la 
columna dos); entonces la media de escolaridad de los trabajadores seria: 


Tabla 11.2 La distribución de años de escolaridad. 


w o 0) 
Años de escolaridad Frecuencia Fix 
2 3 6 
3 2 6 
6 5 30 
3 10 30 
10 3 30 
n 4 48 
13 2 28 
Total N=34 Df = 278 
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278 
a > 8.18 
11.222 Media ponderada 


del 


La suposición de la media aritmética es que todas las observaciones tienen igual 
importancia, pero hay ocasiones en donde a cada observación se le asigna un 
peso. Supongan que los reglamentos principales de contratar nuevos empleados 
en los bancos nacionalizados es que los solicitantes tomen un curso de capaci- 
tación de un mes y presenten tres exámenes, uno al inicio del curso, el segundo 
examen después de dos semanas y un examen final al terminar el curso de capa- 
citación. Los aspirantes con un promedio de 8 serán contratados como emplea- 
dos del banco. Pero los tres exámenes cuentan 20, 30 y 50 por ciento de la califi- 
cación final. Para calcular el promedio de la señorita Blanca Estela, las califica- 
ciones de sus tres exámenes fueron 7, 8, 9, su promedio sería (ver la tabla hipo- 
tética 11 .3). 


Tabla 11.3 Hipotética. 


0.20 (7.0) + 0.30 (8.0) + 0.50 (9.0)8.3 
Media ponderada = 03040307050 


Se aplicó la siguiente fórmula: 


(11.3) 


donde: 


0; = las ponderaciones o pesos. 
Xi = las observaciones. 


11.23 La mediana 
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Es el valor de la observación en el centro (1/2) cuando todos los valores han sido 
ordenados de menor a mayor o de mayor a menor. Por ejemplo, unidades de la 
producción diaria de 10 plantas mencionadas anteriormente, ordenadas en la 
siguiente forma 0 27 34 35 58 62 68 72 72 112. No se puede encontrar la media- 
na porque el número de observaciones es par, si se hubiera tenido una observa- 
ción más o una observación menos, sería fácil encontrar el valor del centro de las 
observaciones. En este caso, cuando hay números pares de observaciones, hay 
que tomar promedio de los dos valores centrales; en nuestro caso (58 + 62)/2 = 60 
sería la mediana de la producción de las plantas. 


11.24 La moda 


Es el valor que se presenta con más frecuencia en un conjunto de observaciones, 
en nuestro ejemplo el 72 ocurre dos veces y el resto de observaciones ocurren 
una vez, entonces 72 es la moda. 

Para ilustrar con claridad estas tres medidas de tendencia central, y sus usos 
e interpretación considerar la Cía. Delta; tiene 10 farmacias en la ciudad de 
Monterrey, sus farmacias son de 5 tamaños y están distribuidas en cuatro zonas. 
La tabía 11.4 muestra estos datos y la venta semanal de cada farmacia. 

Se puede calcular la media, mediana y moda de las tres variables (localidad, 
tamaño y venta) pero en dos variables, localidad y tamaño, algunas de estas esta- 
dísticas no proporcionan información de que su interpretación signifique algo. 
Por ejemplo, ¿qué significa decir que la media de la localidad o la zona es de 
2.07 Absolutamente nada. La localidad no tiene propiedad de orden, es decir, es 
una variable nominal. 


Tabla 11.4 Distribución de la cadena de farmacias Delta. 


Farmacia Localidad Índice de Ventas semanales 
millones de pesos 


A 
B 
Le 
D 
E 
F 
6 
H 
1 

J 


La media y mediana significan estar en el centro de algo, o sea estar aproxi- 
madamente a igual distancia de ambos extremos. Pero si algo no tiene orden o 
valor de distancia asociado con él, entonces el hecho de estar en su media (cen- 
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tro) no significa nada. Pero significa algo decir que el local más frecuente es la 
zona 2, es decir, en la zona dos hay más farmacias de dicha empresa. 

Ahora se va a considerar el tamaño de la farmacia. En esta variable también 
la moda es la única estadística interpretable. En el ejemplo la moda es 4, es 
decir, hay más farmacias del tamaño 4. La variable tamaño es ordinal pero no 
métrica, porque no tiene valor de distancia que indique qué tan grande es la far- 
macia de tamaño $ en comparación con la farmacia de tamaño 2; sólo se sabe 
que 5 es más grande que 2, por lo tanto, será inapropiado decir que su media es 
8.2, pero se puede calcular la mediana y su única interpretación sería que la 
mitad del muestreo tenga un valor de más de 3.5 (la mediana de nuestro ejemplo 
es 3.5) o que la otra mitad tiene un valor menor de 3.5. 

Entonces, se tienen datos nominales como por ejemplo pertenecer a un club, 
la única medida apropiada de tendencia central sería la moda. Si se tienen datos 
ordinales como actitudes, se puede calcular la mediana y la moda. Si se tienen 
datos intervalares y proporcionales, se pueden calcular las tres medidas de la 
tendencia central.? 

La media aritmética toma en cuenta todos los valores de distribución, se 
hace que la media sea sensible a los valores extremos: si una persona en un 
grupo de diez gana 60,000 pesos cada mes y otra gana 5,000 pesos, la media de 
los ingresos sería 10,500 pesos, lo cual no es una buena representación de la dis- 
tribución, La mediana describe en forma más adecuada datos sobre ingresos per- 
sonales o gastos domésticos, ya que unos cuantos valores muy grandes tienden a 
“inflar” la media aritmética. 

Para calcular la mediana y la moda se requiere ordenar los datos. La media 
no requiere ordenar los datos, cuando una investigación tiene un gran número de 
datos será más fácil obtener la media que la mediana o la moda. 


11,3 MEDIDAS DE TENDENCIA CENTRAL 


Tabla 11.5 Distribución de respuestas hipotéticas. 


Ponderación 

o clave A B Cc 
1 400 300 600 
2 300 800 0 
3 200 100 200 
4 100 o 200 


2 Mueller John, H. Sehuessler Karl, F. y Costner Herbert L. Sratistical reasoning in sociology, 3ta. 
ed. Boston: Houghton Mifitin, 1977, pp. 115-121. 
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Las medidas de tendencia central, determinan el valor más representativo de la 
distribución. Sin embargo, una descripción completa de la distribución requiere 
que se mida la dispersión hacia un valor central. Las observaciones actuales son 
distribuidas dentro de muchos valores y el grado de dispersión varía de una dis- 
tribución a otra. Para ilustrar esta idea se consideran las tres distribuciones de 
respuestas hipotéticas en la tabla 11.5. 

En todos los casos la respuesta media es 2, no obstante que das distribuciones 
sean muy diferentes. De hecho, sólo en el caso B la media representa adecuada- 
mente la respuesta típica, ya que en el caso C ninguno de los 1,000 entrevistados 
respondió con la clave 2. En la gráfica de las tres distribuciones (figura 11.1) se 
puede ver que la principal diferencia está en la extensión de los diagramas de res- 
puesta con respecto a la media, la cual es más fácilmente apreciable en la figura 


Frecuencia 

600 500 

400 400 

200 Su 200 

12534 1234 
6500 
400 
200 
1234 


Figura 11,1 Tres distribuciones distintas con igual media. 


Frecuencia de respuesta 
Frecuencia de respuesta 


EN 


2.0 Respuesta 


A 


20 Respuesta 


Figura 11.2 Dos distribuciones respuestas de diferente extensión pero con 
igual media. 
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11.2 cuyos dos casos tienen media igual a 2 pero hay mayor extensión en el mar- 
cado con A que en el B. 

El grado de dispersión hacia un valor central se puede obtener mediante 
varias medidas designadas como medida de dispersión. En esta parte se describe 
la medida de variación cualitativa, el rango, desviación media, la varianza, la 
desviación estándar y el coeficiente de variación. 


11.3.1 La medida de variación cualitativa 


Si en una población dada, una de las varias categorías tiene mayor frecuencia 
(domina a otras categorías), la diferencia entre esta categoría y otras categorías 
será mayor, por lo tanto, no habrá mucha dispersión, es decir, la dispersión será 
menor. Para ilustrar esta idea, considerar la composición religiosa de varias 
colonias en México, D.F, En una colonia en la que viven solamente cristianos, 
no hay diferencia religiosa, pero en una colonia como la Polanco en la que viven 
cristianos, judíos y de otras nacionalidades, hay variaciones pequeñas o grandes. 
La cantidad de la variación depende de la composición de la comunidad (colo- 
nia), cuando la mayoría de la gente que vive en una colonia son judíos, el núme- 
ro de diferencia religiosa sería relativamente pequeño. Si la mayoría de la gente 
está dividida entre varias religiones la diferencia sería más grande. 

Para encontrar la medida de la variación cualitativa se puede aplicar la 
fórmula: 


(11.4) 


Diferencia observada total. 

Frecuencia de la categoría i. 

Frecuencia de la categoría f. 

Número de categorías en la distribución. 
Frecuencia total. 


Ejemplo 


En una fábrica trabajan 10 musulmanes, 30 cristianos y 20 judíos. 
La diferencia religiosa sería: 


(10 X 30) + (10 < 20) + (30 X 20) = 1,100 


Diferencia máxima posible 
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nti-=DG% 3x2 (60? 
2 nn. =2 3 2120 


MYC = Diferencia observada total 
Diferencia máxima posible 


1,100 


= 1200 = 92 


La medida de variación cualitativa variará de O a 1, cero indica no variación 
y uno indica máxima variación. ? 


11.32 El rango 


El rango mide la distancia entre los valores mayor y menor en una distribu- 
ción. Por ejemplo, considera una serie de datos 4, 8, 10, 21, 35, el rango es 
35 — 4 = 31, El rango requiere que los datos sean ordenados de mayor a 
menor y que los datos sean a menos en una escala ordinal, El rango a veces 
proporciona información importante, sobre todo cuando las estadísticas no 
expresan la realidad. Por ejemplo, dos empresas con un promedio de salarios = 
15,000 pesos, tienen diferentes rangos de pagos. Una tiene un rango de 2,000 y 
la otra tiene un rango de 9,000. Sin esta información adicional proporcionada 
con el rango, muchos piensan que la escala de los pagos en ambas empresas es 
igual. El rango es una buena medida, para obtener una impresión rápida de los 
datos y es fácil de calcular. La principal limitación del rango es que considera 
solamente los valores extremos de un conjunto, y no proporciona mayor infor- 
mación respecto a los demás valores del mismo. 


11.33 Desviación media 


Mide la variación promedio de los valores con respecto a la media del grupo, sin 
tomar en cuenta el signo de la desviación. La desviación media toma en cuenta 
todas las observaciones en una distribución, se puede calcular mediante la 
siguiente fórmula: 


Desviación media = (11.5) 


donde: 


3 Para conocer la aplicación de la medida de variación cualitativa ver Nachmias David y 
Rosenbloom David. Measuring burocratic representation and integration, Public Administration, 
Review 33, 1973, pp. 590-597. 
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Xi = La observación y. 
X = Media aritmética. 
N = Número total de observaciones. 


|xi — X] = La diferencia absoluta. 
Ejemplo 


Los años de experiencia de los trabajadores muestreados de una fábrica textil 
“x” es 3108 6 164 2 calcular su desviación media. 


Xi Xx Xi-X [Xi - X] 
3 7 -4 4 
10 7 3 3 
8 7 1 1 
6 7 -1 1 
16. 7 9%. d. 
4 7 -3 3 
2 7 -=5 5 
Sumas 0 26 

26 
Desviación media = “7” = 3.7 
11.34 Varianza 


El cálculo de la varianza es similar al de la desviación. La única diferencia es 
que en el cálculo de la varianza no se toman desviaciones absolutas sino que se 
elevan al cuadrado antes de ser sumados. 
Se puede calcular la varianza mediante la fórmula 
7 


A 06 XP 


Ñ (11.6) 
La fórmula más simple 
ELA 
2 
e (11.7) 
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113.5 Desviación estándar 


La desviación estándar es simplemente la raíz cuadrada positiva de la varianza 


(11.8) 


(11.9) 


Ejemplo S= 


Se puede calcular la varianza y la desviación del ejemplo de los años de expe- 
riencia de la fábrica textil. 


Xi Xx Xi-X (Xi XP 
3 7 -4 16 
10 7 3 9 
8 7 1 1 
6 7 -1 1 
16 7 a 24 
4 7 3 9 
2 7 =5 25 
Sumas 0 142 
PRES 
Ss = 7 
20.3 
5=45 


La varianza es el promedio de Ja dispersión en la distribución. 
Para calcular la varianza yvla desviación estándar para datos agrupados se 
puede utilizar la fórmula. 


OXP —(ciXi? IN 
1 


s 1.1 
> m7 (11.10) 


en donde: 
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Xi = Punta media de la clase ¿, 
6; = Frecuencia de la clase ¡. 
El coeficiente de variación 


Es el grado de desviación con relación a la media. Este coeficiente refleja la 
variación relativa. El coeficiente se usa cuando existe una diferencia grande 
entre las medidas de las diferentes muestras. Por ejemplo, una desviación están- 
dar igual a 2 tendrá diferente interpretación con relación de otra desviación 
estándar igual a 6 con una media igual a 60. 

Para calcular el coeficiente de variación se puede aplicar la fórmula, 


v= Xx (11D 
donde: 


Y = Coeficiente de variación. 
$ = Desviación estándar. 
X = Media aritmética. 


Aplicación y ventajas de la desviación estándar 


La desviación estándar tiene varias ventajas en comparación con otras medidas 
de dispersión. Es más estable de un muestreo a otro. Tiene propiedades impor- 
tantes que permiten al investigador hacer importantes interpretaciones y aplicar- 
la para las inferencias estadísticas. 

La desviación estándar se aplica en el análisis de inversión y medición del 
riesgo, etcétera. 


Ejemplo 


Considerar que dos proyectos de inversión A y B, tienen un promedio igual a 
500. La desviación estándar es 63.25 y 5 16.20 respectivamente. El proyecto A 
es mejor, porque cuanto menor sea la desviación estándar menor será el riesgo 
del proyecto. 

Otro ejemplo, considerar los datos ficticios de la tabla 11.6 que muestran la 
media y la desviación estándar de las satisfacciones de los trabajadores de cuatro 


Industria Industria Industria Industria 
química automotriz del calzado máquinas 
electrónicas 


Media — Desviación Media Desviación Media Desviación Media — Desviación 
estándar estándar estándar estándar 


67 10 6.7 12 66 32 65 13 
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diferentes industrias. 


Tabla 11.6 Datos ficticios. 

La media es casi igual, lo cual indica que la satisfacción es similar en todas 
las industrias. Sin embargo, hay diferencias en la desviación estándar. La desvia- 
ción estándar relativamente baja en las industrias químicas, automotriz y máqui- 
nas electrónicas, indica que la satisfacción entre trabajadores de estas industrias 
es homogénea mientras que en la industria del calzado la desviación estándar 
indica que la satisfacción en esta industria es común entre sus trabajadores. 


11.3.6 Distribuciones de frecuencias 
Tabla de frecuencias 


La forma más común de presentar la distribución de datos en tablas es la distri- 
bución de frecue::cias. Entonces, una distribución de frecuencia es un método de 
clasificación de datos en clases o intervalos de tal manera que se pueda estable- 
cer el número o porcentaje de las observaciones (es decir, la frecuencia) de cada 
clase. Esto proporciona una forma de observar un conjunto de números sin que 
se tenga que considerar cada número y pueda ser extremadamente útil al mane- 
jar grandes cantidades de datos. 

Es muy fácil elaborar la tabla de frecuencia, pero se recomienda observar 
los siguientes pasos o características de la tabla: 


1. El título de la tabla debe identificar las variables que hayan sido presen- 
tadas. 

2. Establecer las clases o intervalos. 

3. La tabla debe mostrar el tamaño del muestreo. 

4. Contar el número de cada clase y presentar los resultados en forma de 
frecuencia. 

5. Si la tabla presenta datos secundarios, se debe presentar una nota de la 
tabla indicando sus fuentes. 

6. El número y temaño de clases debe ser entendible. 


Para establecer las clases de la distribución se deben efectuar los siguientes 
pasos: 


1. Determinar el rango. 

2. Decidir el número de clase por considerar. Algunos autores de libros 
estadísticos dicen que el número de clase no debe ser mayor de 15 ni 
menor de 5. Para encontrar el número de clase se recomienda considerar 
la raíz cuadrada del tamaño de muestreo como número de clase. 

3. Determinar la amplitud de clase. La amplitud de clase se puede encontrar 
dividiendo el rango + el número de clases. 

4. Considerar los intervalos preliminares; simplemente considerando un 
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húmero entero por debajo del valor más pequeño, como límite inferior y 
sumar el límite inferior con la amplitud de clase para encontrar el límite 
superior. 

5. Presentar las clases de tal forma que eviten la confusión y la repetición 
de un número en dos clases. Para los números continuos usar el signo 
“menor que” (<). Por ejemplo: 


3a<8 


8a<13 
13 a< 18, etcétera. 


Para los números discretos no se presentan tales dificultades. 


Ejemplo: 


Suponga que la producción mensual de la fábrica textil durante los últimos 28 
meses €s la siguiente (vea tabla 11.7). 


Tabla 11.7 Producción mensual de la fábrica textil en 
millones de metros, 


Fuente: Datos ficticios, 


1. El rango de nuestro ejemplo es 108.4 

2. La raíz cuadrada del muestreo es de 5.3 y se consideran 6 clases. 
3. La amplitud de la clase es 108.4/6 = 17.9 6 18. 

4. El limite inferior de la clase es = 13. 

5. El límite superior es 13 + 18 = 


Clase Marcas Frecuencia Porcentaje Porcentaje 
acumuladas 

13a<3] mí 5 18 18 
3Ma<49 mi 6 21 38 
49a<67 Tn 4 4 53 
67a<85 Tr El 12 66 
852< 103 TH 4 14 9 
103 a > 121 mu 6 va] 1.00 
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Tabla 11.8 Distribución de frecuencia. 
La distribución de frecuencia acumulada como se ve en la tabla es nada más 
la suma de frecuencias de clase. 


Distribución de frecuencias para datos nominales 


La distribución de frecuencias de datos nominales es bastante fácil ya que no 
requiere calcular el número de clases y su amplitud, sino que el número de clase 
es igual al número de categoría. 


Ejemplo 


Suponga que el gerente de una empresa desea saber el estado civil de sus traba- 
jadores para asignarles cierta compensación familiar; la tabla 11.9 muestra el 
estado civil de los trabajadores y su distribución. 


Tabla 11.9 Distribución de frecuencia del estado civil. 


Categeortas Frecuencia Porcentaje Frecuencia 
acumulados 


Casados 52 21 21 
Divorciados 
con hijos 
Divorciados 
sin hijos 
Solteros 
Unión libre 


Total: 250 1.00 


11.4 PRESENTACIÓN GRÁFICA 


Existen varias formas de describir gráficamente la información. El investigador 
debe elegir el método de acuerdo con el tipo de datos y la idea que se desea 
comunicar, Se pueden usar gráficas circulares (diagrama de pastel) y gráficas de 
barras u otro, 

A continuación se presentan las gráficas que más se utilizan. 


114.1 Histogramas 


El histograma es un tipo de representación en gráfica de barras de un conjunto 
completo de datos. Los componentes de un histograma son: 
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100- 
90- 
15 
2 60- 
E 
E as- 
£ 
30- 
15- 
Cantidad 
de 
E producción 


1 3 49 67 85 103 11 


Figura 11.3 Histograma de la producción de tela. 


+ El título para identificar la población en estudio. 

+ La escala vertical para denotar la frecuencia de las clases. 

+ Laescala horizontal que presenta las fronteras de las clases (ver la figura 1 1.3). 

Se puede representar en otra forma, considerando la escala vertical la fre- 
cuencia de cada clase. 


11.4.2 Polígono 


El polígono de frecuencias es un tipo de representación en gráfica de líneas, se 
construye de manera similar al histograma con la excepción de que las marcas de 
clase están siempre en la escala horizontal colocando un punto al nivel de frecuen- 
cia correspondiente a cada clase. Después hay que unir los puntos de frecuencia. 
Cada polígono de frecuencias debe empezar y terminar en cero. La figura 11.4 
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Figura 11.4. 
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representa los datos de la fábrica textil como polígono de frecuencias. 
Los componentes de los polígonos son iguales que los de los histogramas. 


11.43 Ojiva 


Una ojiva es un polígono de frecuencias acumulativa. Toda ojiva debe empezar 
en cero y terminar en 100 por ciento. Los componentes de ojiva son similares a 
los de histograma. La figura 11.5 presenta la ojiva del ejemplo. 


11.4,4 Diagrama de pastel 


Es un círculo que se divide en número de clase y se presentan las frecuencias de 


Figura 11.6 Diagrama de pastel. 
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cada clase a través de su porcentaje de frecuencia correspondiente. La figura 
11.6 presenta el diagrama de pastel del ejemplo. 


11.5 TIPOS DE LA DISTRIBUCIÓN DE FRECUENCIA 


Se ha mencionado que una forma simple de describir una distribución es grafi- 
carla y visualizar. También se explica cómo graficar una distribución. En la 
figura 11.7 se presentan diferentes tipos de la distribución de frecuencia. 

El eje vertical representa la frecuencia y el eje horizontal el de la observa- 
ción. La distribución a es una distribución simétrica, es decir, las frecuencias en 
ambos lados son idénticas. En este tipo de distribución muchas observaciones 
están concentradas en el medio de la distribución. Un ejemplo típico de este tipo 
de distribución es la estatura del hombre. Pocos hombres son muy altos o muy 
bajos. Esta forma ocupa un lugar importante tanto en la estadística teórica como 
en la aplicada. 

En las distribuciones no simétricas, hay muchos valores extremos concentra- 
dos en una dirección de la distribución. Una distribución no simétrica en donde 
hay muchos valores pequeños se le llama distribución asimétrica negativa. 

Como el caso hb de la figura 11.7, cuando hay muchos valores grandes la 
distribución será asimétrica positiva. 

La distribución asimétrica se puede identificar según la posición de sus 
medidas de tendencia central. 

En la distribución simétrica, media, media y moda tienen el mismo valor, 
pero en las distribuciones asimétricas hay discrepancia entre estos valores. En la 
distribución asimétrica negativa la media estará en la dirección de los valores pe- 
queños; en la distribución spewed positiva la media estará cerca de los valores 
grandes. Estas propiedades de la distribución asimétrica hacen que la selección 
de las medidas de tendencia central sea crítica, es decir, cuando la media tiende 
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Figura 11.7 Tipos de distribución. 
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Figura 11,8 Curva normal: 


a un valor grande o pequeño pierde su representatividad, por lo tanto, es mejor 
utilizar la mediana o la moda como medida de tendencia central, 


11.5,1 La curva normal 


La curva normal es un tipo de distribución simétrica (forma de campana) que 
tiene un valor importante en la inferencia estadística. 

La figura 11.8 ilustra una curva normal. La curva normal tiene las siguientes 
características: 


1. Es simétrica en forma de campana. 

2. La media, mediana y moda de la distribución normal es idéntica. 

3. El área total bajo la curva normal es del 100%. 

4. La curva está basada en un número infinito de observaciones. 

5. Con una sola fórmula matemática se puede describir la relación entre la 
frecuencia y el valor de una variable. 

6. El área bajo la curva entre la media y cualquier otro punto, es una función 
del número de desviación (ver la figura 11.8). 


115.2 Distribución normal estándar 
Para evaluar la proporción de las observaciones dentro de cierto intervalo, se 


deben expresar en términos del número de desviación estándar de la media. 
Algebraicamente esto se puede representar con la fórmula 
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Xi-X 
2=5 (11,12) 


donde 
Z = Número de desviación estándar a partir de la media. 
Valor de la observación 

Media aritmética, 

S = Desviación estándar. 


La distribución normal de probabilidad asociada con la puntuación estándar, 
Z, es la distribución normal estándar, que se presenta en el Apéndice 4. La tabla 
de la distribución normal estándar tiene cierta particularidad, los valores de ente- 
ro y la primera decimal (como 1.5, 2.2, .03, etcétera ) se encuentran hacia abajo 
en el lado izquierdo de Ja tabla, mientras que el último dígito aparece en la parte 
superior. A fin de mostrar cómo usar la tabla, para calcular ciertas áreas bajo la 
curva, supóngase que interesa conocer el área entre la media y la Z. 

Cuando Z es igual a 1.5,2, En primer lugar se debe localizar el valor 1.5 en 
el lado izquierdo de la tabla, y después 0.02 en la parte superior de la tabla, El 
área bajo la curva se puede leer en la intersección de la fila Z = 1.5 y 5 columna 
0.02, es el valor .4357 (vea la figura 11.9), 


Figura 11.9 Área bajo la vurva normal para Z = 1.52, 


El valor ,4357 es la probabilidad de que una puntuación Z, seleccionado alea- 
toriamente esté entre la media y 1.52, 


Ejercicio 11.1 Encuentra el área bajo la curva normal a la derecha de Z = 1,62. 


0.5000 | 4474 


Z=1.62 
4474 4,5000 = .9474 


Figura 11.10. 
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0.4641 | 4981 
Z=1.8 Z=0 Z= 29 
P1S<Z<0)+(0<Z<29)=0.4641 +.4981 =0.9622 
Figura 11,11, 


El área a la derecha de la media es exactamente de 0,5000. Se nos ha pedido 
el valor del área que no está incluido en la porción que, según la tabla mide = 
0.4474 (figura 11.10). 


Por tanto, se resta 0.4474 de 0.5000. (0.5000 — .4474 = .0526). 


Ejercicio 11.2 Encuentre el área a la izquierda de Z= 1.62. 
Ejercicio 11,3 El área entre Z= 1.8 y Z=2.9 (ver la figura 11.11). 


APLICACIÓN 


Suponga que la distribución de los salarios de la industria automotriz es normal, 
con una media = 10,000 pesos y una desviación estándar = 2,000 pesos y se 
desea determinar qué proporción de los trabajadores tiene un salario entre 6,000 
y 10,000 pesos. 


SOLUCIÓN 


Se deben convertir los 6,000 pesos a unidades de desviación estándar mediante 
la fórmula de Z. 


6.000 — 10,000 
2= "po 72 


Después se busca en la tabla de distribución normal (vea el Apéndice 4), se 
encuentra que .4773 de todas las observaciones están entre la media y Z = 2. En 
Otras palabras 47.73 por ciento de todos los trabajadores de dicha industria 
ganan entre 6,000 y 10,000 pesos. 

Si se quiere encontrar qué proporción de los trabajadores ganan entre 
11,000 y 5,000 pesos, se puede obtener este porcentaje convirtiendo los salarios 
a unidades de desviación estándar, es decir, encontrar el valor de Z y después 
buscar la probabilidad de dicha área en la tabla 


11,000 — 10,000 


200 “05 


z= 


15,000 — 10,000 
2 Ez 
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47.73% 


X= 6,000 X= 10,000 
Figura 11.12, 


La tabla muestra que .4938 está incluido entre la media y Z=2.5 y .1915 
entre la media y 0.5 unidades. Entonces .4938-.1915 =.3023, o sea 3023% (ver 
la figura 11.12). 


X= 10,000 


Suponga que el flujo de caja de la Cía. GAMA se distribuye normalmente 
durante el año con una media de 10 millones de pesos y una desviación estándar 
de 500,000 pesos. ¿Qué posibilidad hay de que la compañía tenga un déficit de 2 
millones de pesos? 


8'000,000 — 10'000,000 
= 500,000 A 


El área bajo la curva para Z = — 4 es 0.4997, es decir, hay 49.97% de posi- 
bilidad que la empresa tenga un déficit de 2 millones de pesos durante el año. 


11.53 La prueba £ 


Según la teoría de límite, cuando el tamaño de la muestra es mayor que 30 
(n > 30) la distribución de muestreo de las medias será casi normal. Sin embar- 
go, para muestras de 30 o menos (2=2,2=3,1=5,n= 18... hasta n = 30) la 
aproximación normal a O es adecuada. Los cálculos de los intervalos de confian- 
za se deben basar en la “distribución 1 cliente” desarrollados por W. S. Gosset. 
Esta distribución fue creada para muestreos pequeños (menores de 30). 

Un valor observado de 1, se define como una puntuación estándar. Por lo 
tanto, las fórmulas de £ y z, en sí son iguales y la Única diferencia es que en la 
fórmula de Z se conoce la desviación estándar de la población (6). Una buena 
estimación de “o” es “5” la desviación estándar muestral. 
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estimación de “g” es “S” la desviación estándar muestral. 
Entonces la fórmula de r es: 
Xu 
T= Sin (11.13) 


donde: 


X = La media muestral. 

H = La media poblacional. 
Desviación estándar muestral. 
n= Tamaño de muestreo. 


La prueba de £ para dos muestreos seráz 
qe XX 


se y 
ER (11.14) 


Cuando se conoce la desviación estándar de la población o cuando N > 30 la 
fórmula que se usa es: 
Para un muestreo 
LA (11,15) 


Para dos muestreos: 


(11.16) 


Aplicaciones 
Suponga que don Raúl desea comprar la compañía TOFIGH; don Carlos, el 
dueño de la empresa, dice que ésta le produce un promedio de 500 millones de 
pesos de utilidades anualmente. Suponga que el precio de un negocio en marcha 
se encuentra mediante la siguiente fórmula: 

NeM=u-1 

donde: 


N.e.M = precio de negocio en marcha 
Tu = promedio de utilidad 
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Don Raúl tomó el promedio de utilidades de los 10 años anteriores para poder 
probar si el promedio mencionado por don Carlos es cierto. El resultado del pro- 
medio de utilidades durante los 10 años es de 400 millones de pesos con una des- 
viación estándar igual a 2'000,000, con un grado de 95% de confianza, 


HO: u = 500 

HO: u < 500 

400 — 500 
T= 


A 8 


o=.05 gl 
valor crítico de ¿ = 2.26 


Como + calculada es mayor que * crítica (15.82 > 1262) se rechaza HO y se 
concinye que el promedio de ganancia es menor de 500 millones de pesos anuales. 


Ejemplo 


Suponga que la compañía X afirma en sus mensajes publicitarios, que las pilas 
que produce duran 100 horas. La Procuraduría del Consumidor toma 150 pilas 
para probar la validez de los mensajes publicitarios; el promedio de horas que 
las 150 pilas trabajaron fue de 60 con una desviación estándar de 6; utilizando 
un nivel de significancia igual a 0.05, se puede afirmar la validez de los mensa- 
jes de la compañía X. 


HO: y = 100 
Hy.u < 100 
100 — 60 
2/V150 


11.6 ANÁLISIS BIVARIADOS 


Las técnicas estadísticas de análisis bivariados son aquellas cuyo objetivo princi- 
pal es encontrar la posible relación entre dos variables. El término bivariado se 
emplea para describir dos piezas de datos que varíen cuando estén relacionadas 
de alguna forma. Matemáticamente expresado, los datos bivariados constituyen 
pares ordenados; se les llamará Y y x donde Y es el valor de la primer variable, x 
es el valor de la segunda. Están ordenados porque un valor, en nuestro caso el de 
Y, siempre aparece primero. Se puede decir que son “aparejados” porque los dos 
valores se relacionan uno con otro mediante una regla de correspondencia. 
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valores se relacionan uno con otro mediante una regla de correspondencia. 

Relación entre variables es la experiencia de todos los días, por ejemplo, el 
sexo de un individuo depende de su forma de vestir, la temperatura del día tiene 
relación con el número de refrescos que vende don Jesús en la calle, etcétera. 
Cuando hay dos variables relacionadas, si se tiene el valor de una variable se 
podrá estimar el valor de otra. 


11.6.1 Relación entre dos variables nominales 


En varias ocasiones el administrador tiene que tomar decisiones con datos nomi- 
nales. Suponga que la empresa gubernamental X quiere saber la relación entre el 
sexo y preferencia por dos deportes, futbol y beisbol, y a fin de tomar decisiones 
comerciales se entrevista a 2,000 aficionados al deporte y se encuentran los 
siguientes datos (ver tabla 11 .10): 


Preferencia por ver un 


partido 
Sexo Total 
Masculino | 782 418 1.200 


Femenino 230 s70 300 


Como se ve en la tabla 11.10 parece que existen ciertos tipos de relaciones, 
los hombres prefieren ver un juego de futbol por televisión. Respecto al beisbol, 
las mujeres prefieren ir a los partidos que verlo por televisión. Entonces, los 
entrevistados de la tabla (11.10) muestran la existencia de una ocurrencia con- 
junta, o sea, el sexo masculino prefiere ver futbol, mientras que el sexo femeni- 
no prefiere ver beisbol. Sin embargo, como el tamaño de la muestra de los sexos 
son diferentes, si se convierten las frecuencias a porcentajes la interpretación 
será más fácil (ver tabla 11.11). 


Pabla 11.11; 
Preferencia por un partido 
Sexo Porcentaje 
total 
Futbol (%) Beisbol (5%) 
Masculino 652 34.8 100.0 
Femenino 23.8 712 100.0 
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La tabla 11.11 permite explicar el comportamiento de diferentes grupos y 
permite entender la causa del comportamiento. Es decir, se puede declarar que si 
hay un partido de futbol en la televisión, la probabilidad de que los hombres afi- 
cionados al deporte lo vean por televisión es de 0.65, Si hay un juego de biesbol, 
la probabilidad de que las mujeres aficionadas al deporte lo vean, es de 0.7 1. 

Hay una posibilidad de que otras variables a pesar del sexo influyan, 
como por ejemplo la educación superior. Para contestar a la pregunta de la 
educación influye en la relación entre el sexo y el ser partidario al futbol o 
beisbol, se necesitan datos respecto al sexo y al gusto de los deportes mencio- 
nados, mientras que controlamos la variable de educación. Se necesita ver la 
relación original que queda sin cambios en diferentes niveles de educación, 
Ver la tabla 11.12. Como se puede apreciar la relación entre el sexo y el gusto 
de ver los dos deportes en diferentes niveles de educación, se mantiene sin 
cambio, éste puede reafirmar nuestra conclusión. Controlando otra variable, 
todavía la relación existiría entre estas dos variables. 


Tabla 11.12 


Educación universitaria 
La preferencia por ver un partido de 


Sexo. >>> Porcentaje | Número 
total de casos 
Putbol (%) Beisbol (%) 
— A ——_—_—_—2 == 2 
Masculino 65.2 34.8 100.0 3400 
Femenino 283 mn 100.0 600 


Educación preparatoria o menor 
La preferencia por ver un partido de 


Sexo Porcemaje | Námero 
total de casos 
Futbol (%) Beisbol (9%) 
Masculino 65.1 349 100.0 800 
Femenino 28.5 715 100.0 200 


Puede ser que el caso no sea como se indica en la tabla 11,12, sino que al 
aumentar otra variable hará que desaparezca la relación original como se verá en 
la tabla 11.13. De cualquier forma, un análisis inicial muestra cierta relación entre 
las dos variables, pero es muy posible que el investigador desee tener un entendi- 
miento completo de estas variables. Este entendimiento implica aumentar otra 
variable en el proceso. Se dice que la relación inicial entre dos variables es una 
relación de cero grados, cuando se aumenta una variable de control se dice que es 
una relación de primer grado. Cuando sean dos variables de control las que se 
aumenten será una relación de segundo grado, y así sucesivamente. 
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aumenten será una relación de segundo grado, y así sucesivamente. 


Tabla 11.13 El gusto de ver un partido por T.V. 


| Educaciónuniversitaria | universitaria 
Porcentaje | Número 
total de casos 


ES 933 EN 0 
ES 95.0 % 


Educación preparatoria o menor 


Futbol (%) Beisbol (%) 


62 93.8 
67 93.3 


Nora: Todos los datos del ejemplo son ficiticios. 


La relación entre dos variables se puede expresar con la correlación Fi, cuan- 
do los datos nominales tienen sólo dos categorías o con la lambda de Goodman y 
Kruskal*s? cuando las variables nominales tienen varias categorías. En esta parte 
sólo se explica la correlación Fi. La correlación Fi, es una forma de expresar la 
relación entre dos variables nominales de dos categorías centrales de la correla- 
ción Fi, la cual se puede calcular mediante la fórmula. 


ad — be 
[a + bxe + dlila + cxb + ay a1.17) 


Las letras a, b, c y d representan las frecuencias en la tabla 11.13 como 
sigue: 


Variable Y 
a E 
a b 
Variable O 
x 


Wassérman Nilliam, y Whitmore G.A.. Applied statistics, Boston: Allyn and Bacon, 1978 


2 si z lector desea conocer lambda de GOODMAN y KRUSKAL?S se recomienda Notes John, 
ol n Allan G., Social staristics without Tears, Mc. Graw Hill, Nueva York, 1977, p. 132. 
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Los signos positivos y negativos son convencionales, simplemente ayudan 
al investigador en su interpretación. Por ejemplo, si la variable x es publicidad y 
la variable y es compra de cierto producto, entonces representará a aquellas per- 
sonas que vieron la publicidad de tal producto y lo compraron. Para el ejemplo, 
los datos se asignarán de esta manera: 


a= 782 b=418 
c=230 d=570 


(782X570) — (418)(230) 
7 =.357 


VFi= [(120080011012)(988)]' 


El rango de correlación Fi es de — 1.0 a + 1, ambos extremos indican una 
relación perfecta mientras que el valor cero indica no relación. 
Para apoyo de interpretación, algunos autores sugirieron la siguiente tabla. 


Tabla 11.14 
Valor absoluto Interpretación 
de la correlación de la relación 
Fi 
arriba de 0.80 muy fuerte 
0.60 40.80 Más O menos 
040 20.60 «débil 
0.2040.40 Tuy débil 
0.00 a 0.20 no existe 


El valor cuadrado de la correlación Fi muestra la proporción de la varianza 
en una de las dos variables explicado por la otra, en nuestro ejemplo (VE? = 
(.357)? = 0.127, esto indica que el 12.7 por ciento de la variación en la preferen- 
cia por ver un partido de futbol o beisbol está explicado por la variación del 
sexo. 


Prueba de significancia de la correlación Fi 
Como la correlación Fi está calculada de los datos de muestreo, el investigador 


debe de determinar la probabilidad de error muestral que produce la correlación 
Fi; por lo que se debe de realizar la prueba de significancia. 


% Nelson, James. The Practice of Marketing Research, Kent, Publishing Company, Boston 
Massachusets, 1982, p. 430. 
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Fi; por lo que se debe de realizar la prueba de significancia. 
La forma simple de la prueba mencionada es utilizando Ji cuadrada (2). La 
prueba de x? se puede realizar mediante la fórmula 


ij — ES? 
HA (11,18) 


donde: 


R = número de categorías en las variables de renglón 
C = número de categorías en las variables de columna 
Oij = frecuencia del valor observado en la celda ¿j 

Eij = frecuencia del valor estimado en la celda ij 


En nuestro ejemplo: 


60m? 5937? —40S? (570 — 395? 
- (182 — 607) ¿418 593) ¿2% 405) ¿8 0 — 395) Z 


Y 607 593 405 395 


255 


El valor de: 


Ho: La correlación Fi poblacional = 0 
Ha: El valor de la correlación Fi poblacional + 0. 


La Ji cuadrada de la tabla con a: = 0.05 y 1 grado de libertad es igual a 3.81 
como y? calculado > y? crítica aceptamos que el valor de la correlación Fi 
poblacional no es cero. 


11.6.2 Relación entre dos variables ordinales 


La relación entre variables ordinales en comparación de los datos nominales 
es más compleja e interpretable. Esto sucede por la naturaleza de estos tipos 
de datos como propiedades de igualdades y ordenados. Entonces, en lugar de 
decir que una categoría de una variable conjuntamente ocurre con una catego- 
ría de otra, se puede decir con escala ordinal de medición que la relación de 
dos variables variará conjuntamente en una dirección particular. Por lo tanto, 
las variables ordinales permiten decir que una variable se incrementa cuando 
otra variable se incrementa o una variable se incrementa cuando otra se decre- 
menta. Es decir, que las variables cambian en la misma dirección o en dife- 
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Ejemplo 


La contratación de un nuevo empleado para el sistema nacionalizado de la 
Banca en México. Suponga que se desea medir la variable “desempeño” en el 
programa de adiestramiento. Todo aspirante en el programa de adiestramiento 
recibe un rango de 1 a 20 según sus calificaciones en los exámenes en el pro- 
grama, Hay 20 aspirantes los cuales terminado el programa tendrán un rango 
de 1220. 

Se sabe que en escala ordinal (rango) si un estudiante tiene el rango 2 y otro 
el rango 4, se sabe que el primer estudiante se desempeñó mejor que el segundo. 
Además, se sabe que la diferencia en el desempeño de estos dos estudiantes no 
es igual a la diferencia de desempeño de otros dos cuyos rangos son 16 y 18, 
Algunos valores pueden ser iguales pero no todos. Los últimos dos estudiantes 
que tuvieron un desempeño menos satisfactorio tendrán el rango 19 y 206 (19 + 
20)/2= 19.5. 

Suponga que el director del programa de adiestramiento quiere ver, después 
de un año, la relación entre los rangos de estos aspirantes con el desempeño de 
sus trabajos después y espera encontrar una relación positiva. Los resultados se 
indican en la tabla 11.15. 


Tabla 11.15 El rango de los 20 empleados de la banca nacionalizada. 


Rango de Rango de Rango de Rango de 
Empleado escuela desempe- | Empleado | escuela desempeño 
de adies- ño de de adies- de 
tramien- trabajo tramien trabajo 
10 10 
Carotina 1 ES Susana u 9 
Verónica 2 4 Alma rn 15 
Mónica 3 1 Amelia 13 8 
Lupita 4 E Juan 1 1 
Víctor 5 2 César 15 19 
Karla 6 py Blanca 16 17 
Carlos z. 5 Irma 17 14 
Luz María 3 10 Rebeca 18 20 
Luis 9 6 Patricia 19 18 
Manuel 10 15 Javier 20 16 
—l 
Rho de Spearman 


Para evaluar los rangos de Jos empleados de la banca nacionalizada y buscar la 
relación se usa la estadística RHo de Spearman. Se busca que si existe esta rela- 
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relación se usa la estadística RHo de Spearman. Se busca que si existe esta rela- 
ción en un empleado que recibió rangos altos después del adiestramiento, tam- 
bién tiene un rango alto después de un año de trabajo. 

La estadística RHo se obtiene mediante la fórmula: 


RHo=1- (11.19) 
n 


donde: 


RHo =RHo de Spearman 
Di =La diferencia entre ambos rangos del individuo ¿ 
n = tamaño de muestra 


Se va a mostrar la elaboración de la prueba con la mitad de los datos de la 
tabla, o sea sólo las primeras JO personas. Como se ve en la tabla, se saca la 
diferencia de rango y se eleva al cuadrado, la suma de estos dos cuadrados mul- 
tiplicado por 6 el numerador de la fórmula 


20 
Y DR=4+4+4+ eS +16= 194 


151 


60194) 
RHo=1-= 20(400 — 1) =0.85 


Tabla 11.16 Rango de los empleados de la banca nacionalizada. 


Rango de Rango de de- 
escuela de sempeño en 
adiestramiento el trabajo 

3 
4 
1 
7 
2 
12 
5 
10 
6 
Manuel 0 15 


El coeficiente RHo tiene un rango de —1.0 a + 1.0, —1,0 muestra una rela- 
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nula, También se debe evaluar el valor cuadrado de RHo para analizar la propor- 
ción de estadística explicada por errores muestrales. 


Probar la relación de rangos suponga: 


Ho: el valor RHo poblacional es = 0 
Ha: el valor RHo poblacional es + 0 


Se utiliza la estadística Z para la prueba de significancia 


RHo-0 
Z= VA =T (11.20) 


Se compara el valor Z calculado con el valor Z de la tabla 
Si — Zoritica E Zoalculada $ + Zorítica 


se acepta Ho, si no existe esta relación se rechaza Ho. 


0.85 — 0 
Zeatcutada = Tag 1 370 


Z de la tabla es = 2.58; como Z calculada ES MAyor que Z crítica Se rechaza Ho y se 
infiere que con un a = 0.01 el valor de RHo poblacional no es igual a cero. 

Hay varias limitaciones en el coeficiente RHo, los datos deben de ser mayo- 
ves de 10, además, no debe de tener muchos pares, sino hay que usar la prueba 
gamma de Goodman y Kraskalls:5 


P-0 
gamma =p g 


11,6.3 Relación entre variables intervalares y proporcionales 


Las variables intervalares y racionales proporcionan información como valores 
de igualdad, rango y distancia, entonces, si se compara la relación entre dos 
variables ordinales, la relación entre dos variables racionales o proporcionales, 
proporcionan más información. No sólo tienen el poder de relación (la relación 


$ Weiss, Robert S., An Introduction, Statistics in Social Research, Nueva Yotk, John Wiley $ Sons., 
1968, pp. 269-274, 
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proporcionan más información. No sólo tienen el poder de relación (la relación 
positiva o negativa) sino que también permiten expresar cómo el incremento en 
una variable (variable independiente) influye en la otra variable (variable depen- 
diente). 


Ejemplo 


Supóngase que un mayorista del producto x cuya oficina central está en 
Guadalajara, distribuye el producto en 20 ciudades y que el mayorista tiene 10 
vendedores. Algunos viven cerca de sus territorios de su zona de venta y otros 
viven a cierta distancia de ésta. Al administrador le interesa saber si existe una 
relación entre el ingreso de ventas de clientes (minoristas) a la distancia a la que 
se encuentre el minorista de la residencia del vendedor. Para cada vendedor, el 
administrador selecciona un cliente (minorista) al azar, registrando el ingreso de 
venta obtenido del cliente y la distancia del cliente (minorista) hasta la residen- 
cia del vendedor (representante de la empresa). La tabla 11.17 muestra esta 
información: 


Tabla 1LI7 
Distancia en Ingreso por venta 
lilómetros (millones) 
10 07 
123 16 
94 19 
112 01 
230 03 
194 09 
18.8 16 
15 24 
71 02 
25 30 
16.5 05 
24.1 5 
24.1 03 
42 19 


El valor del coeficiente de la correlación lineal se puede calcular mediante 
la fórmula: 


ny) — ENOy) 
"== VADO - (E Var) - y (1121) 


al aplicar la fórmula en el ejemplo, se deben de realizar ciertas operaciones pre- 
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Tabla 11.18 Operaciones para calcular r. 


;3 e y y 5 
10 10 07 0.49 0.70 
128 163.84 1.6 2.56 20.48 
94 88.36 19 3.61 17.86 
12 125.44 0.1 0.01 La 
230 529.00 03 0.64 -18.40 
19.4 376.36 09 0.81 17.46 
183 353.44 L6 2.56 30.08 
1.5 225 24 5.16 3.60 
7.1 50.41 02 0.04 142 
25 6.25 30 9.00 7.50 
165 272.25 05 025 8.25 
24,1 580.81 5 2.25 -36.15 
24.1 580.81 03 0.09 123 
42 17.64 19 3.61 7.93 


2x = 1756 3? = 314786 Xy=106  Xy?=31.68 Xxy=3137 
(Ex)? = 30,835.36 (ZY) = 112.36 


11.6.4 Correlación lineal 


El análisis de correlación tiene como objetivo medir la fuerza de una relación 
entre variables. El coeficiente de correlación lineal r es la medida de la fuerza de 
la relación lineal entre dos variables. El coeficiente de correlación tiene un rango 
de —1.0 a +1.0, los valores —1. y +1., indica relación perfecta y el valor ceto 
muestra la correlación nula. El coeficiente de correlación r, puede tener relación 
positiva o relación negativa. Se utilizan y y x como dos variables, si incrementa 
y debido a un aumento en x, se afirma que Ja relación es positiva. Si disminuye y 
cuando incrementa x, la correlación es negativa. Si incrementa y pero x no incre- 
menta, entonces no hay relación. 


14(31.37) — (175.6)(10.6) 


dd V14(3147.86) — (30335.36) y 14(31.68) — (112.36) 


1422.18 _ 1422 _ 


(115.04)(18.20) 2093.73 


La prueba de significancia para coeficientes de correlación r se puede reali- 
zar mediante la fórmula, * 


* Guilford P., Fundamental statistics in psychology and education 4a. ed. Nueva York, McGraw- 
Hill, 1965, pp. 161-164. 
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l+r 
1.1513 logi0 1-14 70 


Zeateiada = "17 3 (11.22) 


Ho: valor poblacional de r= 0 
Hi: valor poblacional de r + O 


Se compara el valor de Z calculada con el de Z de la tabla. 
Si —Z erírica E Z calculada E + Z crítica NO Se rechaza Ho. 
Si la condición no es así se rechaza Ho. 


32 
1.1513 logio 1.68 70 —.6386 
1 301 


z= 


como Z= — 2.12 


Z crítica €s = 2.08 menor que Z calculada NO se rechaza Ho. 


z x 


Figura 11.13. 
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11.7 ANÁLISIS DE VARIANZA 


Muchos métodos estadísticos se basan en el análisis de varianza. Ejemplo: el 
análisis de regresión y el análisis factorial. Además, los problemas científicos y 
en las respuestas a muchos fenómenos la varianza o estudio de diferencia es pri- 
mordial. 

Varios factores intervienen en la varianza. Estos factores se han dividido en 
dos grupos, varianza intergrupos y varianza intragrupos. Entonces se puede divi- 
dir la varianza total en: 

Varianza total = varianza intergrupos + varianza intragrupos. 


Ejemplo 


Un investigador desea saber el efecto de tres tipos de adiestramiento en la pro- 
ductividad de 500 trabajadores; selecciona al azar 45 individuos y divide en tres 
a cada grupo de diferente adiestramiento y después mide su productividad. 

La varianza intergrupos es la de los tres tipos de adiestramiento, o tres tipos 
de tratamiento; es decir, la manipulación experimental. El científico aplicó a un 
grupo cierta variable y a otro grupo una variable distinta. Estos tratamientos dis- 
tintos seguramente harán que los grupos y sus medias difieran; por tanto, habrá 
varianza intergrupos. 

La varianza intragrupos se refiere al error aleatorio, es decir, cualquier equi- 
vocación en el muestreo, la división de grupo, etcétera, se puede decir que la 
varianza de error es la varianza de las mediciones. No todos los fenómenos y 
acontecimientos se pueden explicar; por lo tanto, gran parte de la variación no 
tiene posibilidad alguna de identificación y control. Esto es una varianza de 
error, Esta varianza se puede determinar si se calcula la varianza de cada grupo 
por separado, y después se promedian estas varianzas por separado. La figura 
11.14 “lustra esta explicación. 


Variación Variación 
debido al debido al 
tratamiento tratamiento 
1 2 


Varianza intragrupos 
(error) 


Figura 11.14 Demostración de distintas varianzas. 


ANÁLISIS DE VARIANZA 317 


El análisis de varianza consiste en descomponer la variación total existente 
en un conjunto de datos en los elementos que la integran. Como ya se explicó, 
cada elemento o componente se identifica con una causa o fuente de variación 
conocida, además, hay un componente que representa la variación debido a fac- 
tores incontrolables (errores). Para explicar simbólicamente se puede decir que 
sí se tienen dos n observaciones Yn y su media está denotando como Y, la varia- 
ción total con respecto a la media queda comprendida dentro de la suma de las 
desviaciones de y al cuadrado (Yi — Y P, la cual se denomina suma de cuadrados 
total (SCT). El análisis de varianza descompone esta suma de cuadrados en dos 
grupos. La suma de cuadrados de fuentes de variación (tratamientos) y la suma 
de cuadrados o variación debido a error. 

En la figura 11.15 se muestran los componentes de la suma de cuadrados 
total (SCT). 


S.CT. 


ser. 


Suma de cuadrados Suma de cuadrados 
tratamiento error 
(intergrupos) (intragrupos) 


Figura 11.15, 


El propósito de esta división de la variación total y su cálculo que se realiza 
mediante una tabla conocida como tabla de Análisis de Varianza ANOVA es la 
razón F, que también se conoce como la razón Fischer, en honor de Ronald 
Fisher, el inventor del análisis de varianza. 


Varianza debido a fuentes de variaciones (intergrupos) 


F= A _ . 
Varianza debido a error (intragrupos) 
Fuente de Grado de Suma de Cuadrados Fo F 
variación libertad cuadrados medios 
SCTR 
Tratamiento EL S.C.TR. CMTR= yg] FX 
| CMTR 
CME con 
SCE 
Error N-K S.CE. CME= E 
Total N=1 | S.CT. 
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SC.E 23 (Yi Y j 
SCT=Y AQUI Y? 


La siguiente tabla general permite entender la denotación anterior. 


Tabla 11.20 Presentación general de un experimento. 


Tratamientos (J) 
Observación 

i 1 2 ES Total 
1 ni y12 YNK 
2 yl Y2 Y2K 
3 Ya 132 Y3K 
N Yni Yn2 . Yn3 YnK 
Total YA Y2 YK Y. 
media Y1 y2 Yx Y. 
No. de observaciones | ml m2 ak 


Como se ve en la tabla 11.20, la razón F se puede obtener mediante 
S.CTIHK 1 
FS SEM k 


El investigador calcula la razón F a partir de los datos observados y compara los 
resultados con las tablas de distribución F con grado de libertad de tratamientos 
(K — 1) y grados de libertad de error (Y — K) con cierto nivel de confianza Q 
(ver el apéndice). 

Algunos ejemplos: 


+ Primer caso. Una empresa estaba usando cierto tipo particular de publicidad, 
con resultados satisfactorios. En un estudio, la empresa investiga si la publi- 
cidad tiene resultados, así como otros tres tipos de publicidad. Después se 
utiliza el análisis de varianza para determinar si uno de los tres tipos de 
publicidad es mejor que el presente, y si es así, cuál es de los tres. 

+ Segundo caso. En una fábrica automotriz se estudian cuatro máquinas que 
cortan círculos de acero con cierto diámetro. El propósito de este estudio es 
determinar si existe una diferencia considerable entre las máquinas, en caso 
afirmativo, retirar dicha máquina para ajustarla. 

» Tercer caso. En un estudio entre los empleados de cierta empresa, se estudió 
la inasistencia de un grupo seleccionado al azar según su antigijedad en dicha 
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la inasistencia de un grupo seleccionado al azar según su antigiiedad en dicha 
empresa, sexo, estado civil y tipo de empleo. Se aplica el análisis de varianza 
para determinar si las variables independientes conjuntamente tienen un fuer- 
te impacto en la variable dependiente y cuál de las variables independientes 
tiene mayor relación con la variable dependiente. 


117.1 Análisis de varianza de un solo factor 


El ANOVA de un solo factor es el caso más simple, y consiste en analizar el 
efecto de un solo factor (variable independiente no métrica) que posiblemente 
influye en una variable dependiente. La variable independiente puede tener 
varios niveles (tratamientos). 


Ejemplo 


La compañía Maya es distribuidora de artículos para escritorio y muebles de ofi- 
cina. El director de ventas piensa que los vendedores que tienen muchos años 
trabajando en la compañía, no buscan nuevos clientes (no son dinámicos) sólo se 
dedican a vender a los mismos clientes. Se decide aleatoriamente seleccionar 18 
vendedores dividiendo en tres grupos de seis, conforme a la antigiiedad en la 
compañía, es decir, que el grupo 1 tiene 6 años de servicio, el grupo 2, de 4a 5 
años y el grupo 3 más de 6 años. El director de ventas desea saber si hay una 
diferencia significativa entre los años de servicio y el número de clientes nuevos 
encontrados por el empleado durante 6 meses. El director de ventas presenta la 
siguiente información al director de investigación y desarrollo: 


ler. grupo 20. grupo grupo 
40 32 41 
32 31 38 
25 20 34 
35 21 40 
30 28 36 
36 30 39. 
193 168 28 
3 28 38 
594 

3 


El departamento de investigación calculó las sumas de cuadrados para ela- 
borar la tabla de ANOVA. A continuación se presentan los cálculos. 
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SCT = 538 


(198% (168% (28? (5949 
SCTR= ¿+A - 


6 18 
= 300 
SCE = 538 — 300 
= 238 
Tabla 11.21 
Años de servicios (factir 1) Suma de Media de 
renglón renglón 
Condición condición condición 
física ler. grupo — 2o.grupo 3er grupo física fisica 
40 32 41 
YN 31 38 
25 20 34 
Buena 35 2 40 
30 28 36 
39 
Bi 
yá 
pe 
Regular 
di 
vi 
24 29 35 
19 21 29 
21 2 27 
Mala 20 16 2 
19 27 28 
23 19 26 
Xy; 126 132 174 
yá 21 22 29 432 24 
Suma total 
columnas 436 468 558 1512 28 
Media de Gran Gran 
columna 2 26 31 total media 
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Tabla 11.21 
11.7,2 Análisis de varianza de dos variables o diseño factorial 


En el análisis de varianza de dos variables, se trata de ver el efecto de dos o más 
variables independientes nométricas, sobre una variable dependiente métrica, Se 
conocen como diseño factorial de varianza, en donde dos o más variables inde- 
pendientes cambian o varían en forma independiente o interactúan mutuamente 
para producir variación en la variable dependiente. El hecho de que el investiga- 
dor pueda planear y analizar interacciones simultáneas de dos o más variables 
está considerado como un logro importante de los diseños experimentales. 

El análisis factorial trata de dividir la variable total a variación intergrupo 
(tratamientos) y variación intragrupo (error) pero, Ja variación intergrupo se 
divide a su vez en variaciones causadas por cada variable o factor y además la 
variación debida a interacciones de los factores. Para entender con más claridad 
la idea regresamos al ejemplo de la empresa maya, supóngase que el director de 
ventas cree que los vendedores que tienen mejor condición física son más actí- 
vos y traen más clientes nuevos. Después de un examen médico, se divide a los 
vendedores en tres categorías de condición física 1) buena, 2) regular, 3) mala. 
El número de nuevos clientes que traen cada seis vendedores en cada categoría 
de condición física (la columna) y los años de servicios en la empresa (renglón) 
se ilustra en la tabla 11.21. 


eh 'uentes de Suma de Cuadrados 
ión cuadrados medios 


Tratamiento 300 
Error 238 
Total 538 


Conclusión 


Se busca en la tabla de distribución F para encontrar el valor critico de F4s con 
x=.05. Según la tabla este valor es 3.68, menor que el F' calculado, entonces se 
puede llegar a la conclusión de que hay una diferencia significativa entre los tres 
grupos de vendedores con respecto al número de nuevos clientes que encontra- 
ron durante los últimos seis meses. 

En un análisis de varianza de dos factores hay cuatro fuentes de variación 1) 
entre columnas, 2) entre renglones, 3) interacción y 4) el error. La variación o 
varianza de error es la varianza intragrupo y las otras tres son de varianza inter- 
grupo. La varianza del error es varianza de factores incontrolables y sirve como 
denominador en todas las razones de F, en la tabla ANOVA, 
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Tabla 11,22 ANOVA de dos factores. 


Fuentes de Grado Suma de 
de 
variación libertad cuadrados 


Años de 
servicio 2 252 
(columna) 


10.76 F3s =3,18 


Condición 
física E 736 
(renglón) 


31.43 Fás =3.18 


Interacción 
factor 1 y 4 288 
factor 2 


6.15 Fis = 2.56 


Ervor 


Hoy: La duración de los años de servicio del empleado no influye sobre la 
cantidad de nuevos clientes. 

Ha: Si la duración del servicio del empleado no influye en la cantidad de 
nuevos clientes. 

Ho»: La condición física no influye en la cantidad de nuevos clientes. 

Ha»: La condición física influye en la cantidad de nuevos clientes. 

Hoz: No hay efecto de interacción entre duración de servicio y la condición 
física sobre la cantidad de los nuevos clientes. 

Haz: Existe efecto de interacción sobre la cantidad de los nuevos clientes. 


En los efectos de los dos factores (variables) indudablemente se conocen el 
efecto principal y el efecto de los dos factores conjuntamente, pero para saber 
exactamente en dónde está la relación significativa se puede realizar la prueba 
de Scheffé para encontrarla. 

Si el lector desea conocer más a fondo el análisis de varianza se recomien- 
dan las cuatro obras mencionadas al pie de página. 


LNeter, John y Wasserman, WiDiam, Applied linear Estatistical Models, Richard D., Irwin, Inc. 
1974, US.A. 

2 Morison F., Donald, Multiwriate Statistical Methods, McGraw-Hill Book Company, NuevaYork, 1967. 
3 Hair F.. Joseph. Anderson E., Ralph, Tatham L., Ronald y Carablowsky, Bernie. Mulrivariabe 
analysis, Petroleum Publishing Company, Oklahoma, 1979. 

4 Bhattacharyya K., Gouri, y Johnson, Richard.. Statistical Concepts and Methods, John Wiley € 
Son, Nueva York, 1977. 
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Si el lector desea conocer más a fondo el análisis de varianza se recomien- 
dan las cuatro obras mencionadas al pie de página. 


11.8 REGRESIÓN 


Regresión es una técnica estadística que intenta desarrollar una línea recta o 
ecuación matemática lineal que describa la relación entre una variable depen- 
diente y una o más variables independientes. A través del análisis de regresión el 
investigador puede determinar la significancia estadística de la relación, medir 
el grado de relación y cuantificar naturaleza y forma de la relación. 

También se puede encontrar relación causal, es decir, se puede intuir una 
relación de causa y efecto; cómo explicar los cambios en la demanda de automó- 
vil en términos del ingresos familiar, o la velocidad de un automóvil puede ser 
un factor para determinar la distancia de frenado, o explicar la cantidad de ferti- 
lizante que utilizó un agricultor en la cosecha de maíz, etcétera. El análisis de 
regresión solamente indica qué tipo de relación matemática existe, pero ni la re- 
gresión ni la correlación se pueden establecer. 

Si una variable tiende a “causar” ciertos valores en otras variables, se puede 
aplicar el análisis de regresión para predecir los valores futuros de una variable, 
por ejemplo, predecir la demanda de ciertos productos, para predecir el éxito de 
un empleado en la realización de su trabajo. 


11.8.1 Análisis de regresión lineal simple 


Para este tipo de análisis se pueden generar datos por medio de un experimen- 
to; por ejemplo, supóngase que el director de una clínica desea conocer la pro- 
ductividad de las recepcionistas y la cantidad de adiestramiento que reciben. 
Se puede seleccionar a 20 recepcionistas, a 5 de adiestramiento durante cuatro 
semanas, a otras 5 de capacitación durante 3 semanas, a otras 5 de 2 semanas 
de capacitación y al final al último grupo de una semana de capacitación, y 
después mide la cantidad de pacientes que registran durante 10 días hábiles, 
suponiendo que la clínica tiene muchos pacientes. 

Se pueden usar datos primarios generados por medio del cuestionario (por 
ejemplo, para encontrar la relación entre el ingreso familiar y los gastos en 
comida). O se pueden usar datos secundarios. 

Para ilustrar la regresión lineal, supóngase que se desea encontrar la rela- 
ción entre las horas de trabajo de los técnicos y el número de televisores arma- 
dos. 

La tabla 11.23 muestra estos datos (datos secundarios de archivo). 

Para estudiar la relación entre dos variables, la primera etapa más lógica es 
encontrar en un diagrama la intersección de cada dos variables, como se ve en la 
figura 11.16. 

La figura 11.16 muestra que sí existe la relación lineal. Es decir, que los 
datos están concentrados alrededor de una línea recta. 
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Tabla 11.23 


Número de 
televisores 
armados 


Lunes 
Martes 
Miércoles 
Jueves 
Viemes 
Lunes 
Martes 
Miércoles 
Jueves 
Viernes 


33883582328 


Donde bo es la ordenada en el origen, bi es la pendiente de la línea, Y es la 
variable dependiente y X es la variable independiente. 
La figura 11.16 muestra esta relación. 


Pero el modelo estadístico es: 
Yi = bo+bXi 


dondei=1,...,n 
Yi = variable dependiente ¿ 


25 so 75 100 15 150 as 200 


Figura 11.16. 


REGRESIÓN 325 


Yi = bo+bXi 
donde ¿=1,....n 


Yi = variable dependiente i 

bo = intercepción 

bl pendiente de la línea 

Xi = variable independiente 

ei error aleatorio en el valor observado de Y a un nivel fijo de X 

ei =.es la diferencia entre el valor observado Y el valor previsto de Y, 


(Yi — Y.) que se conoce como residual. Ver la figura 11.17. 


Figura 11.17. 


Se espera que el error tenga una media = 0 y varianza = 0? El análisis de 
regresión estima esta varianza. Ahora bien, si e es la cantidad de error presente 
en el valor observado de Y, y el valor medio de Y, en el nivel particular de x. 


Línea de regresión 
Y = bo +bIX 


(Y) 


>X 


Figura 11.18, 
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11.82 El método de mínimos cuadrados 

El método matemático más común para estimar bo y bl es el método de los 
mínimos cuadrados. Una característica muy importante de este método es que la 
suma de los cuadrados verticales de los puntos a partir de la recta es mínima. 
Simbólicamente el valor que se minimiza es: 


(mi-Y? 


Los valores de bo y b1 para la recta que minimiza la suma de los cuadrados 
de las desviaciones son las soluciones de las “ecuaciones normales” 


2 Y=nmbo+b2X) 
EXY = bo(Ex) + (EX?) 


se puede despejar para bo y bl y resultando fórmulas sencillas para calcular bo 
y bl. 


2 Y-+EX ¿CE -ENEXN 
bo = ó 


a 1 Xx”) — EX? 
y ="EXM-EXEN 
E) — XP 


Precisión de los estimadores 


Se sabe que los datos que se utilizan en un análisis de regresión son datos mues- 
trales, o sea pocas observaciones de una población infinita de pares de 


Tabla 11.24 
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trales, o sea pocas observaciones de una población infinita de pares de 


Tabla 12. 
pa FÉXM) - EEN _ 10661800) — (L100X(500) _ 7 


nx) — (xP 10(134660) — (1100? 


bo= EY) -bIEX) _ 500 — 0.4978(1,100) 
n 10 


bo = 4,75 
Í = - 4,75 + 0.4978 X 


Valores 


Entonces la línea de regresión, resultado del análisis, es como una estimación de 
la relación real. Por lo tanto, los coeficientes de regresión bo y b1 son estimado- 
res de los parámetros de población, 

Una medida de la regresión es el error estándar de estimación que se puede 
calcular mediante la fórmula. 


S= 
donde: 


$ = error estándar de estimación. 
Yi = valor observado i. 

¡ = valor estimado del punto i. 
nh = número de observaciones. 
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La forma de error estándar de estimación es idéntica a la de desviación 
estándar; donde Pi es como la media y la razón de tener n— 2 en el denominador 
en vez de n-1 es que al calcular los coeficientes de la línea (bo y bi) se pierden 
dos grados de libertad. 

Hay dos factores que afectan al error estándar de estimación y que incre- 
mentan estos dos factores, son: 


1. Hay mucha variación en los datos, es decir, los datos están dispersos. La 
dispersión en la población significa que para cualquier valor de .x, habrá 
muchos valores posibles de Y. 

2. La suposición de la línea recta no es apropiada; es decir, la relación de las 
variables no es lineal, puede ser cuadrática, binomial o logarítmica. 


La tabla 11.25 muestra cómo calcular el error estándar de estimación. El 
valor de error estándar muestra qué tan exactas son las estimaciones de regresión. 

Cuando el análisis de regresión es para pronosticar ciertos fenómenos, el 
error estándar sirve para predecir tales fenómenos pero con ciertos rangos consi- 
derando uno, dos o tres errores estándar, según el grado de confianza que el 
investigador considere. 

La evaluación de los residuales, como se ve en la tabla 11.25 en la columna 
(Yi — Yi), proporciona información para ampliar la interpretación. El valor(Yi — 
Yi) se puede probar para determinar que si se distribuyen normalmente, se puede 
usar la prueba del signo para este propósito. 

Además, estos residuales permiten probar qué tan preciso es el modelo de 
regresión; permiten conocer la estructura de los datos. El análisis de los residua- 
les se conoce como “análisis de desviaciones particulares”. En este análisis se 
busca identificar a aquellos residuales muy lejos de cero; para investigar por qué 
el valor previsto está tan lejos del valor observado. 

Como los coeficientes de regresión son muy sensibles a tales variaciones 
grandes, por el hecho del proceso de mínimo cuadrado; tal vez, será necesario 
eliminar aquellas observaciones, para obtener unos estimadores más precisos,” 
Al eliminar las observaciones muy desviadas, el 1? (coeficiente de determina- 
ción) aumentará. Si se eliminara una observación desviada o no, depende en el 
propósito del análisis de regresión. 


11.8.3 El coeficiente de determinación r? 


El coeficiente de determinación es una forma de decir qué tan bueno es el mode- 
lo. Este coeficiente indica proporción de errores que ha logrado reducir mediante 
el método de mínimos cuadrados. 

Es la razón de la variación explicada de la variación total: 


7 Belsley, David, Kuh, Edwin y Welsch E.. Roy, Regresión diagnostics: identifying influential dara 
and sources of collinearity, Nueva York, John Wiley $: Sons, 1980. 
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Sa variación explicada 


variación total 
Y 0-Y 

1 
Y q Y? 


¿=1 

El valor del coeficiente de determinación tiene un rango de 0 al 1.00, cuando 
la variación explicada es un pequeño porcentaje de la variación total +? sea peque- 
ño; por el contrario, cuando la dispersión es poca indica que la variación explicada 
contiene un mayor porcentaje de la variación total; por lo que +? se aproxima a 
1.00. y? es muy útil en la interpretación del modelo de regresión múltiple. 

Para el ejemplo sería como sigue: 


2 rif 
z>-_-—_—— 11.895 = 1.37 


Tabla 11.26 
X XX (XX Y YY (PR AX) 
a -37 1369 30 -20 400 740 
50 $0 3600 20 -30 900 1800 
123 18 324 60 10 100 180 
170 60 3600. 80 30 900 1800 
sg -23 529 40 -10 100 230 
108 -2 4 50 0 0 0 
135 25 625 60 10 100 250 
69 -41 1681 30 -20 400 820 
148 38 1444 70 20 400 760 
132 2 484 60 10 100 20 
1100 13660 500 3400 6800 
X= 110 Y=50 
s 1.895 
Sol = == 5 = 5 =0.00014 
X(Xi— XP? 13660 
497 
= = 35.50 
27 "00014 
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11.8.4 Análisis de varianza para la regresión simple 


La significancia de la recta se puede probar utilizando el análisis de varianza, 
Como se observó al calcular el error estándar de los estimadores y el coeficiente 
de determinación, todo el proceso de regresión está basado en la teoría del análi- 
sis de varianza, Además, se debe afirmar en este punto que la prueba de F es 
válida si se puede suponer que las K muestras independientes se obtuvieron a 
partir de una población homogénea o distribuida normalmente. Por lo tanto, se 
realizan pruebas para obtener la independencia entre las K variables, mediante la 
prueba F: 


estimación intermedia de varianza 
estimación interna de varianza 


en término de análisis de regresión 
Ba on 


ja: 2 
sp SO 24D l 
[ h E 
ó 
Suma cuadrada de regresión/g. de L. de regresión de L. de regresión. 
Suma cuadrada de error/g. de L. de error. 


F= 


F= 


Tabla 11.27 Análisis de varianza (A.N.U.A.) 


Fuentes 
de 
variación 


Grados de 
libertad 


SC = regresión h 1X- X= 7) 


S.C. = error zen - EX-D0- PP 
NN n XX — XP 
5.C. total — Sc regresión, 


o 
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5.C. total =x P- E 
n 


CMR = S.C. regresión 
G.L. de regresión 


S.C.error. 


C.M.E. = 
G.L. de error 


F. = se refiere al valor F que se calculó. 

F, = se refiere al valor de F de la tabla que también se llama valor crítico de 
F. Para encontrar este valor se necesitan dos valores: el grado de liber- 
tad de regresión y el grado de libertad de error. 


11.8.5 Prueba de significancia 


Se puede probar la significancia de los coeficientes de regresión (Bo o intercep- 
ción y b 1= pendiente) mediante la fórmula de: 


ES Valor de la muestra — valor esperado _ b—=0 _ b 


desviación estándar Sh sb 


Ho:bo =0 
Hi.bo +0 


Ye 
Ho:bo=0 
Htblko 


La idea de probar estas hipótesis es que si la intercepción y la pendiente tie- 
nen un valor cero. La hipótesis respecto a bl es más importante, si bl no es igual 
a cero; es decir, cuando se rechaza Ho se puede deducir con cierto nivel de con- 
fianza que hay relación estadísticamente significativa entre X y Y. 

Las desviaciones estándar para determinar el valor T que se necesita en la 
prueba de las dos hipótesis antes mencionadas se pueden obtener mediante las 
fórmulas siguientes: 
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S.C.R, = .4978(6800) 


= 3385 
5.C.T. = 28400 = 250000 
10 
= 3400 


SCF = SCT — SCR 
= 3400 — 3385 
=15 


Tabla 11.28 


Fuente de , Suma de cuadrados 
variación 


.S 
1385 1805.33 11.26 
875 


Conclusión: como F. (1808.33) es mayor que F, 11.26 esta situación indica 
que hay una relación significativa entre el número de televisores armados en un 
día con las horas hombre. Esta relación es positiva, es decir, a mayores horas de 
hombre se armarán más número de televisores. 


CAPÍTULO 


12 


Prueba de hipótesis 


12.1 INTRODUCCIÓN 


Inferencia estadística es una de las dos categorías principales del procedimiento 
estadístico y la estadística descriptiva es la otra. Existen dos problemas básicos 
en el tema de inferencia estadística: 1) La estimación del valor de la población, 
que se explicó con bastante claridad en el capítulo 7, y 2) la prueba de hipótesis, 
tema de este capítulo, 

Ahora se describirá la estrategia de la prueba de hipótesis, su procedimien- 
to, la distribución muestral, los dos tipos de error (error tipo 1 y error tipo 2), el 
nivel de significancia y varios métodos para la prueba de hipótesis. 


12.2 LA ESTRATEGIA DE PRUEBA DE HIPÓTESIS 


La primera etapa del proceso de prueba de hipótesis es formular la hipótesis de 
manera estadística. Ya se explicó cómo se puede obtener una hipótesis de una 
teoría O cómo presentar el problema del estudio en forma de hipótesis. Para que 
la hipótesis se pueda probar, debe formularse en términos que se puedan probar 
con modelos estadísticos. Por ejemplo, si el propósito de la investigación es 
encontrar que los empleados con experiencia son más eficientes que los que 
tienen menos experiencia en el trabajo, la hipótesis estadística podría ser aquella 
que indica que existe una relación positiva entre la experiencia y la eficiencia, o 
que la media de la eficiencia de los empleados con experiencia es mayor que la 
media de la eficiencia de los trabajadores con poca experiencia. En los dos 
casos, la hipótesis estadística está formulada en término de estadística descriptiva 
(como la correlación o la media), así como una serie de condiciones específicas 
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acerca de dicha estadística (como una evaluación positiva o la diferencia entre la 
media). 

La hipótesis estadística siempre incluye a la población en estudio. No será 
necesario hacer inferencias si se prueba a la población en estudio directamente; 
0 por lo tanto, cualquier diferencia en la media (o una correlación positiva de 
cualquier magnitud) en este caso apoyará la hipótesis, pero si se muestrea a la 
población en estudio, se deben hacer inferencias. Si los valores estadísticos 
obtenidos de la muestra son diferentes a los valores de la población, esto puede 
significar que la hipótesis es falsa o correcta. Se debe aclarar que los resultados 
o valores obtenidos del muestreo no pueden interpretarse directamente; se nece- 
sitan unas reglas de decisiones para rechazar o aceptar las hipótesis de la 
población en estudio, con base en los resultados obtenidos en la muestra. 

El proceso de la inferencia estadística permite al investigador determinar si 
el resultado de un muestreo particular cae dentro de un rango por mera casuali- 
dad o si no tiene nada que ver con ésta. Este procedimiento incluye las siguientes 
etapas que se tratan más adelante con mayor detalle: 


1. Formular las hipótesis nulas y alternas. ! 

2. Escoger la distribución muestral y las pruebas estadísticas según la 
hipótesis nula. 

3. Especificar el nivel de significancia (01), y definir el área de rechazo. 

4, Calcular las pruebas estadísticas y de acuerdo con los resultados rechazar 
o no rechazar las hipótesis nulas. 


Para aclarar el procedimiento de la prueba de hipótesis se utilizará el siguien- 
te ejemplo: 

El director de finanzas de una compañiía distribuidora de acumuladores, en 
México, está preocupado por el cambio en la tasa de cuentas por cobrar. Él mide 
la tasa de cuentas por cobrar en términos del promedio del número de días que 
las cuentas por cobrar tardan en cobrarse. Suponga que la política de la empresa 
es de 50 días con una desviación estándar de 10 días. El director de finanzas 
ordenó analizar las cuentas por cobrar de todos los clientes y encontró que el 
promedio de las cuentas pendientes ha cambiado a 51 días. ¿Es esta diferencia 
estadísticamente significativa? Por supuesto que lo es, ya que el estudio se reali- 
zÓ mediante un censo, es decir, se analizaron todas las cuentas por cobrar y no 
se tomó una muestra de estas cuentas; el resultado obtenido da como un hecho 
que las cuentas por cobrar por descuido de los responsables ha cambiado a 51 
días. Aunque el cambio es estadísticamente significativo, se debe estudiar cómo 
se analizaron para determinar si es factible o no el cambio en el promedio de las 
Cuentas por cobrar. Esta forma de análisis no es práctica. 

Es muy costoso estudiar con frecuencia todas las cuentas por cobrar de 
una empresa, por lo que usualmente se utiliza el muestreo. Suponga que se 


LA la hipótesis alterna también se le conoce como ta hipótesis de la investigación. 
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toma una muestra de cuentas por cobrar de 25 clientes y el promedio de las 
cuentas por cobrar pendientes es de 54 días. ¿Es estadísticamente significativa 
esta diferencia? La respuesta no es obvia, Será estadísticamente significativa si 
se establece que tal diferencia en el promedio muestral ocurre por casualidad o 
por fluctuaciones muestrales (error muestral). 

Básicamente existen dos formas de realizar la prueba de significancia: una 
de ellas es la comparación del estadístico (valor muestral) con el parámetro 
(valor poblacional), la cual ya se explicó; la otra forma es la comparación del 
resultado de dos o más muestras. Por ejemplo, si se toma una muestra de los 
clientes por cobrar de la empresa en su sucursal de Guadalajara que da un 
promedio de 49 días, otra muestra de dichas cuentas en la sucursal de Monterrey 
que da un promedio de 52 días y otra muestra de las cuentas por cobrar de la 
sucursal de Mérida que da un promedio de 55 días. Estos promedios indicarían 
que las tres sucursales son diferentes en cuanto a la vigilancia de las políticas de 
la empresa respecto a las cuentas por cobrar, o ¿se deben a la casualidad? Para 
poder contestar dicha pregunta se requiere primero conocer la lógica de prueba 
de la hipótesis que se presenta a continuación. 


12.3 HIPÓTESIS NULA E HIPÓTESIS ALTERNA 


Hay dos tipos de hipótesis que intervienen en el proceso de la prueba de hipóte- 
sis: 1) La hipótesis nula (£fo) que es una declaración de que no existe diferencia 
entre el valor muestral (estadístico) y el valor poblacional (parámetro) que ase- 
vera que cualquier diferencia entre el estadístico y el parámetro es resultado de 
la casualidad y de fluctuaciones muestrales, y que además está formulada en el 
proceso de prueba para ser posiblemente rechazada; 2) la hipótesis alterna Ho 
que es la declaración operacional y que es contraria a la hipótesis nula, y es algo 
que el investigador desea conocer. 

Volviendo al ejemplo de la compañía distribuidora de acumuladores en 
México, se puede expresar la hipótesis nula de la siguiente manera: 


Ho: No ha ocurrido ningún cambio en la política de cobranza de 50 días. 


Y la hipótesis alterna se puede expresar en diversas maneras según los obje- 
tivos del investigador. La hipótesis alterna puede ser: 


Ho: La política de cobranza ha cambiado y ya no es de 50 días. 
Ha: La política de cobranza actualmente es mayor que Ja política inicial. 


Las hipótesis también se pueden expresar con símbolos como: 


Ho: u = 50 días Ho: 4 = SO días 
Ha 1 + 50 días o Ha: Y > 50 días 
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La necesidad de expresar dos hipótesis surge de que la hipótesis nula está 
basada en una inferencia negativa para evitar la consecuencia afirmativa. Por 
esto es que se debe de eliminar la hipótesis falsa en lugar de aceptar la hipótesis 
verdadera. 


La distribución muestral 


Después de formular la hipótesis, el investigador procede a probarlas contra los 
resultados obtenidos de la muestra. Por ejemplo, si la hipótesis expresa que no 
hay diferencia entre la política de cobranza de las sucursales (Ho; My = H1>.), el 
investigador debe tomar una muestra al azar en cada una de las poblaciones (por 
ejemplo de las cuentas por cobrar de las sucursales regionales de Guadalajara y 
de Monterrey) compara las dos medias muestrales (X1 y X2) y hacer la inferen- 
cia. Sin embargo, el resultado del muestreo está expuesto a errores muestrales por 
lo que no siempre refleja la realidad. Si se toman muestras del mismo tamaño en 
ambas poblaciones, cada muestra usualmente tendrá diferentes resultados. 

Para determinar la precisión de los valores muestrales (estadísticos), éstos 
se deben comparar con los modelos estadísticos que da la probabilidad del resul- 
tado de tales observaciones. 

Estos modelos estadísticos se conocen como distribución muestral. 

Se obtendrá una distribución muestral de un estadístico (como X o P) toman- 
do varias muestras del mismo tamaño de una población definida, calculando la 
media de cada una, delineando la distribución de la frecuencia, etc. Después se 
compara esta distribución con la distribución normal para verificar la significan- 
cia estadística. Si la distribución es normal no se rechaza la hipótesis nula. 


12,4 NIVEL DE SIGNIFICANCIA Y ERROR TIPO 1 Y ERROR TIPO II 


La suma de las probabilidades de que los resultados de las diferentes muestras 
estén en la zona de rechazo se conoce como el nivel de significancia, Un nivel 
de significancia = .05 6 .01 significa que la hipótesis nula será rechazada, si el 
resultado de las muestras estuviera dentro de los resultados que hubieran ocurri- 
do no más del $ ó del 1 por ciento del tiempo. 

Para probar la hipótesis se adoptan ciertas reglas: aceptar la hipótesis nula y 
no tomar acciones correctivas si el análisis muestra que no se puede rechazar la 
Ho. Si se rechaza ha hipótesis nula (encontrando que hay diferencias significati- 
vas), entonces se aceptará la hipótesis alterna y se toman las acciones apropia- 
das. Al tomar tales decisiones, se está en peligro de hacerlo en forma incorrecta. 
Esto ocuwre si se acepta la hipótesis nula cuando deberíamos rechazarla, o re- 
chazarla cuando se debería aceptar. Estos problemas decisionales se ilustran en 
la tabla 12.1. 

Uno de estos dos estados de la naturaleza existen en la población; la hipóte- 
sis nula es correcta o es falsa. También hay dos alternativas de decisión: aceptar 
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Tabla 12.1 
Decisión Estado de la naturaleza 
La hipótesis es correcía La hipótesis es falsa 
(0) (S2) 
Rechazar la Ho Envor de tipo 1 (0) Decisión correcta 
Aceptar la Ho Decisión correcta Error tipo II ($) 


o rechazar la hipótesis nula. Dos de estas condiciones de la tabla 9.1 resultan ser 
las decisiones correctas, mientras que las otras dos resultan ser errores en la 
decisión. 

En el error tipo I (01) se rechaza una hipótesis correcta. Como se explicó, el 
valor de «: es el nivel de significancia, o sea la probabilidad de rechazar la 
hipótesis nula. 

En el error tipo Il ($) se acepta la hipótesis nula que es falsa. A conti- 
nuación se explican con más detalle estos dos errores. 

Error tipo 1. Suponga que se tiene el mismo problema del director de finan- 
zas de la compañía distribuidora de acumuladores. Si la política de cobranzas ha 
variado, y suponiendo que el promedio poblacional es de 50 días (política ini- 
cial), que la desviación estándar de la producción es de 10 días y que la muestra 
son las cuentas por cobrar de los clientes (1 = 25), con esta información se 
podría calcular el error estándar del promedio (X), es decir, la desviación están- 
dar del promedio muestral. La figura 12.1 muestra esta distribución hipotética. 

La desviación estándar calculada es de dos días: 


a 10 
ox= Y = Vas 2 días 


Zona de aceptación 
p 


rechazo 


Las se 
2 = 0.0228 :=0.00228 


Figura 12.1. La probabilidad de cometer error tipo 1 dado que Ho es correcto, 
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Si la decisión es rechazar Ho y tomar la acción A2 cuando X es menor de 46 o 
mayor de 54, la probabilidad de error tipo 1 está indicada en la parte A de la figura 
12.1 en la zona rayada. Esta área se conoce como la zona de rechazo, mientras que 
el área de 46 a 54 se conoce como el área de aceptación de la hipótesis nula. A las 
fronteras entre las áreas de aceptación y de rechazo se les conoce como valores 
críticos. Cuando la distribución del promedio muestral es normal se puede calcular 
la probabilidad de error tipo 1 en término de los valores de Z”. 


z= Xu 
7 = 1H 7 2 
7-2 A 


en donde: 


Xc = valor crítico del promedio muestra. 

H = valor de la población declarada en Ho. 

Gx = error estándar de la distribución muestral de la media de una muestra 
de tamaño 25. 


En referencia a la tabla 2 del apéndice para encontrar el área bajo una curva 
normal, se puede observar que para una Z= 2, el área a la izquierda de 46 sería 
de 0.0228 y la misma área a la derecha de 54; bajo esta circunstancia la proba- 
bilidad de error tipo 1 sería: 


P(A2/5p) = 0.0456 6 4.56% 


La probabilidad de una decisión correcta si la hipótesis nula es verdad es de 
95.44% . Se puede cambiar la probabilidad de error tipo 1 moviendo el valor 
crítico hacia adelante o hacia atrás del parámetro, es decir, de 50, Se puede hacer 
esto si subjetivamente se desea aceptar una más pequeña o más grande. También 
se puede cambiar el tamaño de la muestra, con lo cual cambiaría la dispersión de 
la distribución. Por ejemplo, si se toma una muestra de tamaño 100, los valores 
críticos que proporcionará una región de rechazo igual a 4.5% serán de 48 y 52, 

Se ha supuesto que con la hipótesis alterna se está interesado en los valores 
menores y mayores que 50 al mismo tiempo; pero es posible que el director de 
finanzas de la companía distribuidora de acumuladores esté interesado solamente 
en encontrar el cambio de políticas mayores de 50 días; es decir, que no le interesa 
que la gente pague antes de 50 días, pero sí que no paguen después de 50 días 

Para esto se usa una prueba de una cola (mayor que) para H, Y se deja toda 
la zona de rechazo en un solo lado de la curva (en este caso el lado derecho, 
como se puede ver en la tabla 9. 1 B). 
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Si se acepta = 0.0456, se calcula el nuevo valor crítico (Xc) utilizando la 
tabla 2 del apéndice se obtiene una Z = 1.69 para una 0. = 0.0456, y sustituyen- 


do valores en la ecuación: Z= 2 y despejando el valor de Xc se tiene 


Xc — $0 
2 
Xc = 53.38 


169 


El área de aceptación está comprendida hasta el valor crítico (Xc) de 53.38 
(ver figura 9.1). 

Error tipo II. La determinación del error tipo II es difícil, porque depende 
del tamaño de la muestra, y en especial del nuevo parámetro poblacional en el 
que se supone se obtienen diferentes niveles de error $ si el nuevo 1 cambia de 
50 a 54 que si sólo cambia a 52. Se debe calcular el error $ en forma separada 
para cada valor de la población y para cada valor crítico Xc. Para ilustrar esto 
suponga que H actualmente ha cambiado de 50 a 52 días. Bajo esta condición 
¿Cuál es la probabilidad de cometer error tipo II, si el valor crítico es de 54? Esto 
se puede expresar con símbolos. 


P (42/51) = a = 0.0228 (suponiendo una prueba de una cola) 
PAS) =B= 


Si el nuevo H es de 52, entonces se tiene: 


La probabilidad $ 
54-52 
z,= =1 = 10.341 
2107125 0, 
0.50 


Z, = de otra parte de la distribución total = 3 + = 0841 

Se muestra esta condición en la figura 12.2 con el valor a: especificado y el 
tamaño de la muestra igual a 25. Como se calculó, hay 84.1% de probabilidad de 
cometer error tipo IL si 1 =52. 


Región de rechazo 


Región de aceptación 
2=0.0228 


B=0.841 


E 52 5 


Figura 12.2 La probabilidad de cometer error tipo II, dado que Ho es falsa. 
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12.5 PRUEBA DE SIGNIFICANCIA 


Las pruebas de significancia se dividen en dos grupos: pruebas paramétricas y 
pruebas no paramétricas. La prueba paramétrica es una prueba estadística basada 
en las siguientes suposiciones: 


1. Las observaciones deben ser de una población normalmente distribuida. 

2, Las observaciones deben.ser independientes. Es decir, la selección de un 
caso no debe influir en la de otro. 

3. Las variables se deben medir al menos al nivel intervalor.? 


Las pruebas paramétricas (prueba £ y F) son más poderosas que las pruebas 
no paraméftricas, pero los datos deben de cumplir con los requisitos de la prueba. 

Las pruebas no paramétricas son aquellas que no especifican la distribución 
normal de la muestra ni el uso de la escala intervalor. Algunas pruebas no 
paramétricas requieren de casos independientes, otras se pueden aplicar para 
casos interrelacionados. Las pruebas no paramétricas son fáciles de entender y 
aplicar. Las pruebas no paramétricas se pueden aplicar a los datos nominales 
y ordinales aunque en las escalas racionales e intervalares también sí se utilizan. 

Para la selección de una prueba de significancia adecuada, se requiere con- 
siderar las siguientes preguntas: 


1 ¿Cuántas muestras incluirá la prueba? ¿Una muestra? ¿Dos muestras?, ¿A 
muestras? 

2. Si es más de una muestra, ¿son casos independientes o relacionados? 

3. ¿Cuál es el nivel de la medición? 


A continuación se presentan diferentes tipos de pruebas de significancia. 


12.6 PRUEBAS PARA UNA SOLA MUESTRA 


El caso de una sola muestra se refiere a cuando se desea probar la hipótesis 
con una sola muestra. En este caso uno se enfrenta a preguntas tales como: 


1. ¿Hay alguna diferencia entre la frecuencia observada y la frecuencia 
esperada? 

2. ¿Hay alguna diferencia entre la proporción observada y esperada? 

3. ¿Es la muestra de una población de una determinada distribución (nor- 
mal, Poisson, etcétera)? a 

4, ¿Hay diferencia significativa entre X y y? 


%Siegal, Sidney, Estadística no paramétrica, Editorial Trillas, México, 1975. 
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12.6.1 Pruebas paramétricas 


Se aplica la prueba “1” para determinar la significancia estadística entre la dis- 
tribución del promedio muestral (estadístico) y la del promedio poblacional 
(parámetro). Los siguientes ejemplos típicos de la aplicación de la prueba “£” 
para una sola muestra son: 


a) Determinar si ha cambiado el promedio de rendimiento del trabajo de un 
grupo de trabajadores seleccionados al azar y que han recibido un adies- 
tramiento especial. 

b) Comparar el promedio de la vida útil de los focos de una muestra para 
poder determinar si la producción está cumpliendo con las especifica- 
ciones de calidad fijadas. 


Por ejemplo: para ilustrar la aplicación de la prueba “f” para una sola mues- 
tra supóngase que se toma una muestra de tamaño 100 de las cuentas por cobrar 
de la Compañía Mexicana Distribuidora de Acumuladores encuentra que el 
promedio muestral es 52.5 días con una desviación muestral igual q 14. ¿Indica 
este resultado que el promedio poblacional es todavía de 50 días? En este pro- 
blema se presenta una situación muy típica en donde se tiene sólo la desviación 
estándar muestral ($). Se debe de usar ésta en lugar de la desviación estándar 
poblacional (6). Cuando se sustituye $ por <, también se tiene que usar la dis- 
tribución “*f” especialmente cuando el tamaño de la muestra es menor de 30, 


Ed 


como “1” se incrementa al aumentar n, al tener 30 observaciones, la distribución 
se acercará a la de la curva normal. La variación de la distribución “f” depende 
del grado de libertad (n - 1) la prueba de significancia aplicando la prueba “r” en 
este ejemplo sería: 


52.5 50 
ta O —Á = 1.786 
14/4100 


Los grados de libertad son iguales an — 1 = 99. 

Supóngase un nivel de significancia = 0.05. 

Se consulta la tabla de distribución “f” (tabla 3 del apéndice) para encontrar 
el valor crítico. Con g. de €- = 99 y a. = 0.05 el valor cítrico es = 1.66. 

Regla de decisión. Como el valor calculado es mayor que el valor crítico 
(1.786 > 1.66) se rechaza la hipótesis nula y se infiere que la política de cobran- 
za ha variado. 
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12.6.2 Pruebas no paramétricas 


Hay varias pruebas no paramétricas que se pueden efectuar en caso de una sola 
Muestra. La prueba binominal, la prueba x ? de una muestra, la prueba de una 
muestra de Kolmogorov-Smimov, etcétera. 

Al seleccionar la prueba no paramétrica adecuada, se debe tomar en cuenta 
la escala de medición que es nominal (tipo clasificatoria), es posible usar la 
prueba binominal o la de x ? de una muestra. 


12.6.3 La prueba binominal 


La prueba binominal es para las poblaciones de dos clases, como masculina y 
femenina, comprador y no comprador, letrado e iletrado, partidarios y no par- 
tidarios, etcétera. En tales casos, todas las observaciones posibles de la 
población caerán en una u otra de las dos clasificaciones. Esta prueba es muy 
útil cuando el tamaño de la muestra es muy pequeño. 

En cualquier población de dos clases, si la proporción de casos de una de 
ellas es P, entonces la proporción de la otra clase será 1 -p (comúnmente se uti- 
liza el símbolo 0D). 


Ejemplo: 


En una fábrica que tiene un gran número de trabajadores, se toma una muestra de 
18 y se les enseñan dos métodos para hacer un moño para cajas de regalo. A nue- 
ve trabajadores de esta muestra se les enseña primero el método Á y a otros nueve 
trabajadores se les enseña primero el método B. Después se les somete a un exa- 
men intensivo de cuatro horas de historia, literatura, etcétera, e inmediatamente 
después se les pide que hagan el moño, sin indicarles con cuál método y se obser- 
va el que utilizan. La hipótesis es que la tensión del examen induce regresión; es 
decir, que los estudiantes tenderán a usar el primer método aprendido. 


Suponga que. 
P=1la proporción de los trabajadores que usan el primer método 
aprendido. 
Qol-P=la proporción de los trabajadores que usan el segundo método 
aprendido. 


Las hipótesis son: 


Hs P=S10 
HP> 10 


Suponga que el resultado de la observación es el registrado en la tabla 12.2. 
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Tabla 12.2 


Método Primer mésodo | Segundo método 
escogido aprendido aprendido 


Usando la tabla de distribución binominal para una O: = 0.01, se tendrá: 


P(T=14|P=1/2)=0154 
P(T= 14|P=1/2)=.0038 


dado que 7 = número de veces que ocurre un evento de la clase 1. Se conoce a T 
como el estadístico binominal. 

En la tabla binominal, se observa que no existe una prueba de nivel Q =.01, 
sin embargo, con « = .0038 se rechaza la hipótesis nula y con QU = .0154 tam- 
bién. La conclusión es: se rechaza Ho con una probabilidad de error tipo 1 de 
.0038 o sea que con ese error tipo 1 se llega a la conclusión de que la tensión sí 
induce a la regresión. 

Es importante notar que en la distribución binominal, es muy común no 
encontrar pruebas con el nivel de significancia deseado. Es conveniente definir 
entonces el nivel observado de significancia. En el ejemplo, el valor observado 
del estadístico es de T= 16, y de la tabla binominal se obtendrá que: 


2=P(T=16|P=1/2)=.007 


A (se le conoce como el nivel observado de significancia del experimento, 
ya que en este ejemplo el área de rechazo está en la cola derecha de la distribución. 


12.6.4 Prueba de Ji cuadrada (2) 


Posiblemente el método más conocido y que más se usa para la prueba de signifi- 
cancia es la prueba de Ji cuadrada. Ésta es particularmente útil cuando los datos 
por probar están en escala nominal, como sí y no, favorable y desfavorable, o 
clases A, B, C y D. 

La prueba es del tipo de bondad de ajuste como la prueba binominal, en 
donde se prueba la diferencia significativa entre la distribución probada de los 
datos, entre las categorías y la distribución esperada basada en la hipótesis nula. 
Se puede aplicar la prueba Ji cuadrada en caso de una, dos o k muestras. 


Ji cuadrada de una sola muestra 


Se debe de establecer la hipótesis nula de donde se deduce la frecuencia espera- 
da en cada categoría, después se comprueba la desviación de la frecuencia actual 
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para cada categoría con la frecuencia que se supuso en la hipótesis. Entre más 
grande sea la diferencia entre ellas, menor será la probabilidad de que estas 
diferencias ocurran por casualidad. El valor de x? mide el grado de esta diferen- 
cia, y que se obtiene con la siguiente fórmula: 


donde: 


0; = número observado de casos clasificados en la categoría ¡. 
E; = número esperado de casos en la categoría ¡ conforme a Ho. 
K  =número de categorías. 


Hay diferentes distribuciones para Ji cuadrada para cada grado de libertad 
(K- 1). Según el grado de libertad, se debe estar seguro de que el número en 
cada celda es suficientemente grande para que la prueba sea adecuada. Cuando 
g: de 1-= 1, cada frecuencia esperada debe ser mayor que 5. Y si el g: de l- es 
mayor que 1 no se debe aplicar la prueba de Ji cuadrada cuando más del 20% de 
las frecuencias esperadas sean menores que 1- o cuando cualquier frecuencia 
esperada sea menor que l. 


Ejemplo: 


El gerente de una cadena de tiendas de ropa asegura que la demanda por las pren- 
das de color azul es el doble de la demanda por las prendas de otros cuatro colores 
(rojo, verde, amarillo y negro). Para verificar su aseveración pide una encuesta 
donde se le pregunta a una de cada 120 personas su color favorito de ropa. 

Los resultados se anotan en la tabla 12.3. 


Tabla 12.3 


RARA 


La hipótesis verbal del gerente sería: 


Ho: P, =2P)=2P3 =2P4=2Ps5 
donde: 
P,= probabilidad asociada con la celda 4 1(color azul) 


Pa,P3,P4 y Ps = probabilidades asociadas con las celdas $ 2, 3, 4 y 5 respec- 
tivamente. 
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Tabla 12.4 


Puesto que la 3, pi = 1, la hipótesis nula sería: 


Ho:P, =2/6, Pa= 1/6, P4=1/6, Pa=1/6, Ps =V6 
Ha: Ay menos una P; es diferente del valor especificado. 


Los valores esperados (bajo Ho) en las celdas son los siguientes: 


E=1n Pp * = (1 20) (2/6) =40 
E2=n Pz *=(120) (1/6) =20 
Es =m Py* = (120) (1/6) = 20 
Ej =n Pts (120) (1/6) =20 
Es =n Ps*= (120) (16) = 20 


El cálculo del estadístico se ve en la tabla 12.4. 


p=y OE? - 190 
A E; 

Suponga que se va a realizar la prueba con una al 0.1: se consulta la tabla de 
distribución de Ji cuadrada (tabla 3 del Apéndice), y con 5 — 1 = 4 grados de li- 
bertad y un = .01 se tiene un valor de 2 = 13.28. 

Como la x? calculada es menor que la Ji cuadrada de la tabla, no se rechaza 
la Ho, y se concluye que con una probabilidad de error del tipo 1 del 1%, la ase- 
veración del gerente es correcta. 


12.7 PRUEBAS PARA EL CASO DE DOS MUESTREOS 


En este caso hay dos muestras y se desea probar el que ambas pertenecen a la 
misma población. La hipótesis nula dice que cualquier diferencia en los valores 
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muestrales o en la distribución muestral, es causada por las fluctuaciones del 
muestreo aleatorio. Ejemplos de este caso podrían ser: el resultado de trabajo de 
dos diferentes muestras o diferentes muestreos para la opinión pública, la com- 
paración del grupo que recibió el tratamiento y del grupo de control en el diseño 
experimental, etcétera. 

Hay dos maneras de probar la significancia en el caso de dos muestras: 


12.7.1 Prueba para dos muestras apareadas 


Las muestras apareadas se refieren a las situaciones en que las personas están 
muy relacionadas, por ejemplo, como marido y mujer, o en ocasiones en que los 
pares de observaciones se hacen en los mismos individuos, del tipo de antes y 
después. Es decir, que se tiene un tratamiento y un testigo, en este caso un indi- 
viduo sirve como su propio testigo. 


Pruebas paramétricas 

Usualmente, la prueba “£” es inadecuada para estas situaciones porque una de las 
suposiciones básicas de la prueba “1” es que éstas deben de ser independientes. 
Este problema se puede resolver si se encuentra la diferencia entre cada grupo de 
observaciones y se juntan las dos muestras en una sola. En este caso se tienen 
varias diferencias independientes unas de otras. 

Pruebas no paramétricas 

Por lo general, se utilizan pruebas no paramétricas para dos muestras apareadas. 
Prueba de McNemar 

Es una prueba no paramétrica adecuada para dos muestras apareadas, y es muy 
útil para probar antes y después a un solo sujeto de estudio. La significancia de 
los cambios de los valores observados se prueba desarrollando una tabla de fre- 


cuencia 2 X 2 que representa las respuestas antes y después de los entrevistados, 
es la tabla 12,5, 


Tabla 12.5 


Antes 


EZ 


A favor 
En contra 
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Como A + D representa el total de entrevistados que cambiaron sus respues- 
tas (B y C son los que no cambiaron sus respuestas), la expectación de la hipóte- 
sis nula es que V, (A + D) cambiarán en una dirección y la misma proporción en 
otra dirección. La prueba de McNemar usa las siguientes transformaciones de la 
prueba Ji cuadrada: 

da-o|- 1? 
= con 12: de 1. 
e A+D d 

La idea de restar 1 en esta ecuación es la correlación de continuidad, como 
la 12 es una distribución continua y la frecuencia observada representa una dis- 
tribución discreta, se necesita esta corrección. 


Ejemplo: 


Para estudiar el efecto de una campaña de publicidad sobre la popularidad del 
régimen de un país X, se pregunta la opinión de los ciudadanos de dicho país (a 
favor o en contra). Se encuentra que 80 personas están a favor y 120 en contra. 
Después de la campaña, se entrevista a las mismas personas, y se encuentra que 
de los 80 que estaban a favor, 62 mantienen su opinión y 18 están en contra, 
mientras que de las 120 personas que estaban en contra, 100 siguen en contra y 
20 están a favor. La tabla 12.6 muestra el resultado del estudio. 


Tabla 12.6 


En contra 


Las hipótesis serían: 
Ho: P(A) = P(D) 
Ha: P(A) + P(D) 


- (118-201 - 19 
*= 18 + 20, 


= 026 
nivel de significancia (£ = 0.05 


n=200 
g:del-=1 
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VALOR CRÍTICO 


Consultando la tabla de distribución de X 2 (tabla 3 del apéndice) se encuentra 
que el valor crítico es de 3.84 para un Q: = 0.05 y 1 grado de libertad. 


DECISIÓN 


Como la x2 calculada es menor que la P de la tabla (valor crítico) no se rechaza 
la Ho, y se llega a la conclusión de que con un dí = .05 la compañía de publici- 
dad no tuvo efecto sobre la popularidad del régimen. 


12.7.2 La prueba Wilcoxon 


También se conoce como prueba de rangos señalados y pares iguales. Esta prue- 
ba tiene una eficiencia excelente cuando es posible determinar la dirección y 
magnitud de las parejas y es más poderosa que la prueba de + estudiante. Esta 
prueba es tal, que da mayor peso al par que muestra una diferencia grande entre 
las dos condiciones que al par que exhibe una diferencia pequeña. 

La mecánica de esta prueba es simple. Se requiere encontrar la diferencia 
para cualquier par igualado, después se clasifican todas las di sin tener en cuenta 
el signo; así se le da el rango de 1 para dí más pequeño, 2 a la siguiente, etcétera . 

En esta prueba pueden ocurrir dos tipos de ligas. Cuando dos observaciones 
tienen puntajes iguales, la diferencia di entre estos dos es cero, por lo tanto, se 
ignoran estas dos observaciones en el proceso de cálculo. Cuando dos o más 
observaciones tienen el mismo valor di, se toma el promedio de los rangos; por 
ejemplo, si dos pares de observaciones tienen d = 1, se asignará 1.5 a cada uno. 
Por tanto, si tres pares pueden tener valores de d iguales a —-1,—=1y+1l-a 


1+2+3 


cada pareja se le asignaría el rango de 2, pues = 2. La siguiente di 


recibiría el rango de 4, porque ya se usaron los rangos 1, 2 y 3. 

La estadística para probar es T, que es la suma de los rangos más pequeños. 

Los estudios típicos que pueden usar este tipo de estadísticas pueden ser: 
estudios entre marido y esposa, o las capacidades de gemelos o un sujeto de es- 
tudio dado antes y después de ciertos experimentos. 

Cuando n < 25 se puede usar la tabla 5 del apéndice y cuando n > 25 la 
suma de los rangos T está prácticamente distribuida en forma normal, de este 
modo, 


nía +1) 
4 


Desviación estándar = 67 = j sta + DOn + 1) 


Media = uy = 
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por lo tanto, la fórmula de la prueba es 


Ejemplo: 


Suponga que se realiza un experimento para encontrar la relación entre nombre 
de una marca y la percepción de la calidad. Se seleccionan 10 personas y se les 
pide probar dos vasos de cerveza y después dar un nombre o rango a cada vaso 
de cerveza. Estas dos cervezas son: un vaso de cerveza de una marca conocida y 
otro de una marca totalmente desconocida pero que tiene la misma fórmula. En 
realidad los dos vasos son de la misma marca. El resultado de las calificaciones 
se usa para una prueba de significancia. 


Ho: no hay diferencia entre la calidad percibida entre los vasos de cerveza. 
Ha: sí hay diferencia entre la calidad percibida entre los vasos de cerveza. 


Los datos y el procedimiento de cálculo se verán en la tabla 12.7, 


Tabla 12.7 


Producto Producto 
con marca sín marca 


Forman. - 


La estadística es 


donde: Ri = rango con signos menos frecuentes. 

Suponiendo que el nivel de significancia sea O = 0.05 con n= 10 pares de 
comparación. 

En la tabla de Wilcoxon, se encuentra que el valor crítico de T para 1 = 9 
(considerando un grado de libertad) y a: = 0.05 es igual a 6. 
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Conclusión: 


Como el valor de T calculado (7 = 5) es menor que el valor de T de la tabla 
(valor crítico) se rechaza la hipótesis nula y se puede expresar que sí hay dife- 
rencia en la calidad percibida de los dos vasos de cerveza sujeta a experimento. 


12.8 PRUEBAS PARA DOS MUESTRAS INDEPENDIENTES 


Este tipo de pruebas es muy común en estudios de contaduría y administración; 
por ejemplo, la prueba del movimiento de precios de dos muestras de acciones 
comunes, la prueba del resultado de dos diferentes técnicas de producción o la 
comprensión de las actitudes de dos muestras de suscriptores de dos revistas 
para determinar si pertenecen a la misma población, etcétera. 


12.8.1 Pruebas paramétricas 


La técnica paramétrica consiste en comparar las dos medias, se puede usar prue- 
ba 1 o prueba F. Han usado la prueba r con más frecuencia que la prueba F. En 
general, la prueba paramétrica se realiza mediante análisis de varianza, 

Si se desea aplicar la prueba £, se deben hacer ciertas modificaciones en el 
proceso del cálculo. Con dos muestreos independientes, se tendrán dos series de 
datos que proporcionan dos estimaciones del promedio poblacional. Interesa la 
diferencia entre las medias. Si tomamos varios pares de dos muestreos indepen- 
dientes, se puede asegurar la distribución de la diferencia entre las medias en 
donde M puede ser cero si los muestreos son de la misma población. El error 
estándar de la diferencia entre las dos medias también se puede calcular. Como 
interesa la diferencia entre dos medias se utilizará como denominador en la 
ecuación de / la diferencia de los dos errores estándar. 


y- 2-Xp 
ox] — X2) 
en donde 
x-Xp= 4, £ 
”n nm 
Ejemplo: 


El director de Recursos Humanos de la compañía X, tiene interés de probar la 
efectividad de dos técnicas de adiestramiento para los trabajadores de nuevo 
ingreso en el departamento de promoción y escoge 26 empleados del departa- 
mento de promoción, los divide aleatoriamente en dos grupos, a un grupo de 
adiestramiento 1 y a otro adiestramiento II. Después, los empleados sin ningu- 
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na consideración de sus adiestramientos empiezan sus labores. Después de seis 
meses, el director revisa su rendimiento en el trabajo y encuentra los siguientes 
resultados. 

Se desea saber si una de las dos técnicas de adiestramiento es mejor que otra. 


Ho: No hay diferencia significativa en los resultados producidos por las dos 
técnicas de adiestramiento. 

Ha: Si hay diferencia significativa en los resultados producidos por las dos 
técnicas de adiestramiento. 


Tabla 12.8 Resultado del rendimiento de los empleados del departamento de 
promoción 


Grupo 1 Grupo H 
Promedio semanal de venta X, = $1,500 Xo = $1,300 
Desviación estándar S$= 225 s- 251 

+ ¿1,500 — 1,300 - 20 214 

Qe. ese 294 
13 Y) 
+ Grado de libertad es = 26 — 2 = 24. Es decir, (n — 1)g: de 1: para cada 
maestro. 


Valor crítico, según la tabla de la distribución r (tabla 3 del apéndice, el 
valor crítico con un d. = 0.05 y g: del: 24 es 1.71. 

Conclusión, como el £ calculado es mayor que el £ de la tabla (2.14 > 
1.71), se reclasificaría la hipótesis nula y se puede concluir que la técnica 
de adiestramiento I probablemente es mejor que la técnica Il. 


12.8.2 Prueba de Ji cuadrada 


La prueba de Ji cuadrada se puede aplicar cuando se desea saber la diferencia 
significativa entre dos muestras. Es muy práctico con los datos nominales, pero 
se puede usar con datos de otros niveles de escalas. El procedimiento general es 
aplicando la siguiente fórmula. 


OS OEP? 
*=Y Y ARE 
donde: el Y 


= valor observado. 
= valor esperado. 
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Ejemplo: 


En una comunidad campesina se tienen dos tipos de productores. Se toma una 
muestra de cada grupo y se clasifica a cada individuo de acuerdo con el nivel de 
tecnología que utiliza; se tienen cuatro niveles de tecnología: N (nula), P (po- 
bre); M (mediano); A (alto). Los resultados se presentan en la tabla 12.9, 

Las hipótesis que se pueden establecer son: Ho: no hay diferencia en el 
nivel de tecnología en las 2 poblaciones. Ha: sí hay diferencia en el nivel de tec- 
nología en las dos poblaciones. 


Tabla 12.9 


Los valores esperados se han anotado en cuadros en las celdas y secalcu- 
laron de la siguiente manera: 


En = HCL - S0%70 _ 392 


N 130 
o 
Ey = E - 922 99 
by = EX - 2092 - 14 
A 
Ey = Boa - 10%2 - 198 
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Tabla 12.10 


(Oij-EyP (OG-EjjP /Ej 


+ Suponga un nivel de significancia Q = .05, 

» Elgde €: =(R- lMc- 1)=(Q2- D(4-1)=3. 

+ Valor crítico = según la tabla de y? el valor crítico para Q = .05 y g:l- = 
3 es de 7.82. 

+ Conclusión: Como el valor calculado es mayor que el valor de la tabla se 
rechaza Ho y concluye que si hay diferencia en el nivel de tecnología de 
ejidatarios y arrendatarios. 


12.83 Otras pruebas no paramétricas 


Se pueden usar otras pruebas no paramétricas bajo ciertas condiciones: cuando 
se prueban dos muestras independientes que a nivel de medición es nominal, se 
puede aplicar la prueba de probabilidades exactas de Fisher. Cuando los datos 
son en nivel ordinal se puede usar la prueba de Mann y Whitney o la prueba de 
mediana. Cuando los datos son en nivel intervalar, se puede usar la prueba de ran- 
domización?. 


12.9 PRUEBAS PARA K MUESTREO INDEPENDIENTE 


Frecuentemente en las investigaciones uno se enfrenta a la prueba de significan- 
cia de tres o más muestreos. En tales circunstancias interesa saber que los 
Muestreos se extraen de la misma población. 


3 Para más detalles en éstas y otras pruebas no paramétricas se puede consultar Mosteller, Frederick 
y Rourke Robert. Sratiscal study, Addison Wesley, 1973, EUA. o Sigel. Sidney-Estadística no 
Paramétrica, Editorial Trillas, 1975, México. D.F. 


354 PRUEBA DE HIPÓTESIS 


12.9.1 Pruebas paramétricas 


Como ya se mencionó, el análisis de varianza (ANOVA) es muy apropiado para 
dos o más muestreos siempre y cuando las condiciones sean apropiadas. Como 
afirma el profesor Kerlinger: “El análisis de varianza no es simplemente un 
método estadístico, sino que también es un enfoque y un modo de pensar”. La 
varianza se manifiesta en diversas formas; como varianza de la población y la de 
muestreo y varianza de efectos de variables o experimentos. La esencia del 
análisis de varianza es que el análisis de varianza emplea en su totalidad varian- 
zas, en vez de usar diferencias reales y errores estándares, a pesar de que dicho 
procedimiento se basa en la idea de la diferencia real comparada con el error 
estándar. Dos varianzas se oponen siempre una con la otra. Una varianza que 
supuestamente depende de la variable o variables experimentales (indepen- 
dientes), se opone a otra varianza que tal vez dependa del error o el azar, es 
decir, se analiza la varianza total en un conjunto de datos descomponiendo en 
sus fuentes componentes, las cuales pueden ser atribuidas a varios factores en la 
investigación. Teóricamente se puede extraer cualquier número de factores, pero 
en la práctica no extraen más de tres factores. Después se determina la signifi- 
cancia estadística, los pasos por seguir son: 


1. Determinar la varianza de cada muestra utilizando la fórmula 


e. 


m=:. 
2. Obtener la varianza promedio de la muestra, mediante la fórmula 


— SAS + SE 
O E 


donde K= número de muestras. 
Si, = estimación de varianza por azar. 


3. Calcular la varianza de las medias muestrales. Para hacer esto, se suman 
primero los valores medios de la muestra y se divide el producto entre el 
número de muestras, a fin de obtener X, que es la media total. La fórmula 
por utilizar sería: 


-26- 
EN 


* Kerlinger, Fred, Investigación del Comportamienso, Interamericana, México, 1975, p. 154. 
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4. Multiplicar la varianza de medias muestrales por n: n + S%se obtendrá la 
varianza debida al efecto experimental o varianza intergrupos. 


5. Razón de la prueba F: 


Resultado de paso 4 _ 1: 5% 
Resultado de paso 2 — (ES”YK 


varjanza causada por el factor x + varianza muestral 
Varianza muestral 


F= 


Si la varianza causada por el factor X es pequeña, la razón F será pequeña 
también, si la razón F es grande, indica que el factor x está causando la mayor 
parte de la variación. 

Para calcular F, se debe seguir el siguiente procedimiento”: 


Estadísticamente expresando la prueba F sería 


Estimación de varianza debida al efecto 
Variación 


prueba F= 


Experimental o varianza intergrupos 
Por azar 


ns 


— SDK 


Ejemplo: 


La Facultad de Contaduría y Administración de la UNAM ha realizado un estu- 
dio para determinar si existían diferencias reales entre cuatro ciudades o zonas 
metropolitanas respecto a salarios medios por hora percibidos por los mecánicos 
de autos. Se han estudiado las áreas metropolitanas de México, Guadalajara, 
Monterrey y Querétaro. Los datos recopilados se presentan en la tabla 12.11. 


5 Stevenson William, Estadística para Administración y Economía, 1981. Harla, México, p. 317, 
adaptado y modificado de esta obra. 


356 PRUEBA DE HIPÓTESIS 


Tabla 12,11 
Observaciones México Guadalajara Momierrey Querétaro 

1 600 1,200 1,100 900 
2 900 1,100 800 700 
$ 900 1,000 1,200 1,000 
4 600 800 900 1,000. 
y 500 900 1,000 900 

3,500 5,000 5,000 4,500 


Suponga que el nivel de significancia es 1 = 0.05. 
Ho: No hay diferencia en los salarios por hora de los mecánicos de autos en 
las cuatro zonas metropolitanas. 
Ha: Sí hay diferencia en los salarios por hora de los mecánicos de autos en 
las cuatro zonas metropolitanas. 
Solución: 


+ Calcular las medias, mediante la fórmula 


x= 24 
Xx = A 
Xouad. = E = 1,000 
Karem. = 22% — 1.000 
Xoro. = 0 = 900 


+ Calcular la media de los valores medios de la muestra. 


EX _ 700 + 1,000 + 1.000 + 900 _ 
k 4 


900 
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+ Ahora, determine la suma de los cuadrados. 


Xx; Media 4 a -X) XP 
México 700 900 200 40,000 
Guadalajara 1,000 900 100 10,000 
Monterrey 1,000 900 100 10,000 
Querétaro 900 900 0 0 


3? 
Ahora la varianza intergrupos 1 = eno = 100,000. 
El siguiente paso es calcular la estimación interna de la varianza o la varian- 
za debido a errores del azar. Para llevar al cabo esto, se obtiene la suma de los 


cuadrados para cada muestra. 


Tabla 12.12 
México 
Xi X México (Xi - X México) (Xi - X México? 
$00 700 - 100 10,000 
900 700 200 40,000 
900 700 200 40,000 
600 700 - 100 10,000 
500 700 - 200 40,000 
1=0 E= 140,000 
Guadalajara 
Xi X Guadalajara Xi-X Guadalajara (Xi-X Guadalajara? 
1,200 1,000 200 40,000 
1,100 1,000 100 10,000 
1,000 1.000 0 0 
300 1.000 - 200 40,000 
900 1,000 - 100 10,000 
z=0 X= 100,000 
Monterrey 

Xi X Monterrey Xi—X Monterrey (Xi — X Monterrey? 
1,100 1,000 100 10,000 
800 1,000 - 200 40,000 
1,200 1,000 200 40,000 
900 1,000 - 100 40,000 
1,000 1,000 0 0 


E=0 Y = 100,000 
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Tabla 12. 12 (continuación) 


Querétaro 
Xi X Querétaro Xi —X Querétaro (Xi—X Querétaro? 
900 900 0 0 
700 900 - 200 40.000 
1,000 900 100 10,000 
1,000 900 100 10,000 
900 900 0 0 
X=0 XI = 60,000 
¡—X e 
+ Calcular la varianza de cada muestra mediante la fórmula Si = a 2 
140,000 100,000 
rg, = 4 Souad = A 
60, 
Saro, = e 
+ Ahora se puede calcular la varianza debido a errores de azar. 
140,000 , 100,000 , 100,000 , 60,000 
19 4 4 4 4 
so EE = m7 = 25,000 


* Por último, se determina la razón F; 


100,000 


F= 35.000 


4.0 


Consultando la tabla de distribución F, de a: = 0.05 con 3, 16 grado de li- 
bertad, la F de la tabla es igual a 3.24. 


Se concluye que como F calculado es mayor que el valor de F de la tabla 
(valor crítico), se rechaza Ho y se puede decir que sí existe diferencia significati- 
va entre las zonas metropolitanas; en otras palabras, la variación se debe a la 
variación entre muestras. Véase figura 12,3. 


Nota: Para determinar los grados de libertad, el grado de libertad del numerador 
es uno menor que el número de muestras, es decir, K-1. 

El grado de libertad del denominador 1 es el número de muestras por el 
tamaño de la muestra menos uno o sea, K(n — 1). 
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0 3.24 40 
Figura 12.3 La distribución F del ejemplo. 
Tabla de análisis de varianza (ANOVA) 
Es conveniente mostrar en forma tabular las partes componentes de los cálculos 
del análisis de varianza. Esto no sólo proporciona una idea de la fuente de 


variación, sino que también permite un mecanismo para comprobar los cálculos. 
El procedimiento es: 


Tratamiento (muestra) 


1 2 K 
Xo Xo Xu 
Xa Xo Xa 
Xa Xu Xm 
Suma ya T T 
k k 
GT=Y T¿IN=Y mi 
I=1 ar 
- GTA 
F.C. m7 
Se calculan las siguientes sumas de cuadrados: 
mi k 
S.C. total = y Y Xi-FC 
(=1j=1 


k í 
S.C. tratamiento = > z 
ES 


$.C. error = S.C. total — S.C. tratamiento. 


=FC. 


Con estas cantidades se elabora la llamada tabla de análisis de varianza 
(ANOVA). 
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Tabla 12.13, ANOVA 


Fuente de Grados de Suma de cuadrados Cuadrado Razón F 
¿o í 

Tratamiento R-1 y a = FC. CM. total 
15 

Error NK por diferencia CM. error 
Moa 

Total N-1 A 
¡E 


La regla de decisión consiste en rechazar Ho si F calculado es > que F tabla 
con cierta Qi y (K-1, N-K) grado de libertad, obtenido de la tabla de valores críti- 
cos de F. 


12.9.2 Pruebas no paramétricas 


Cuando se tienen X muestras independientes con datos de escala nominal, se 
debe elegir la prueba de Ji cuadrada 1é. Se puede utilizar la prueba de Ji 
cuadrada en los datos de un nivel más alto de medición; sin embargo, en estas 
condiciones pierde algo de información. La prueba Ji cuadrada de k muestreo 
independiente es una extensión de la misma prueba para dos muestreos inde- 
pendientes y se calcula igual. 


12.93 Otras pruebas no paramétricas 


Se pueden usar pruebas más poderosas que la prueba de Ji cuadrada, con los 
datos que no son nominales. Una de éstas es la prueba de Kruskal-Wallis que es 
una extensión de la prueba de mediana. 

Dicha prueba es una versión generalizada de la prueba de Mann-Whitney, 
con ella se ponen en orden las puntuaciones de todas las observaciones, de ma- 
nera que las puntuaciones pequeñas se anoten primero, es decir, de la más 
grande hasta la última. Se calcula la suma de las puntuaciones ordenadas de cada 
muestra. Los empates serán considerados como la distribución de otro ejemplo, 
Después, se determina el valor H, mediante la fórmula: 


2 ñ 


1%] 
H= LANA 1 
NN 1) z, yA 
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donde: 

Tj = La suma de puntuaciones ordenadas en la columna ¿. 

nj = Número de observación en la j-ésima muestra. 

N =wj= número total de observaciones. 


K = Número total de muestras, 


Cuando hay varios empates, es recomendable usar el factor de corrección 
(c) que se calcula en la siguiente forma y se utilizan para corregir el valor H. 


G 
Y UB — 1) 


NN 
donde 


G = Número de observaciones empatadas. 
ti = Número de empatados en cada serie de i. 
H=Hlc. 


Ejemplo: 


Suponga que en una fábrica de casimires y trajes se realizó un experimento de 
tres diferentes combinaciones de alimentos para los trabajadores a fin de aumen- 
tar la productividad. 

La productividad se midió durante 4 semanas y se obtuvo un promedio. En 
la tabla 12.4 se presentan los datos de 22 trabajadores con 3 diferentes combina- 
ciones de alimentos. 

La hipótesis es que no hay diferencia en las tres combinaciones. 


Tabla 12.14 Medida de productividad de los trabajadores 
después del consumo de las tres combinaciones. 


Se escriben los datos de los 3 muestreos n =7 +7 + 8 en un orden de 
mayor a menor para encontrar los rangos. 
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Tabla 12,15 Cálculo de rangos. 


Observación Rango Observación — Rango 
120 (22 $T da 
110 Qe») 86 (9) 

105 20) 84 8 
98 19 8l Mm 
96 78 (6) 
96 (18) 75 (5 
96 *(17 74 (0 
95 16) PTA =17 69 5 
94 15 62 a) 
93 14 61 y) 
93 (13) 

9 * (12) AENA =125 
an 2 


Las observaciones que tienen el mismo valor dan los rangos y después se 
toma el promedio para determinar el rango correcto; como se ve en la tabla 
12.15, el 93 se repite dos veces y como el primer 93 recibe el rango 12, el segun- 
do debe de recibir el rango 13, pero se debe de tomar promedio de rangos para 
encontrar el rango apropiado de la observación según las reglas estadísticas. Así 
también la observación 96 se repite tres veces como muestra la tabla 12.15, por 
lo que todos los 96 reciben el rango 17, es el resultado de: 


16+17+18 _ 


7. 
3 


La tabla 12.16 muestra los datos de cada muestreo con sus rangos apro- 
piados. 


Tabla 12.16 Resultado de la prueba de Kruskai-Wallis. 
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-3x23 


2 2 2 
H= 12 (124.5) + (49.0y + 125) 
22x23 El 7 8 


= 79.38 — 69 = 10.38, 


Para aproximarse a la distribución de Ji cuadrada como la prueba de Wilco- 
xon, se aplica la siguiente fórmula, para ajustar la estadística de Kruskal-Wallis. 


H 
7 
1- Y gitg?— Din — 1) 
a] 


en el ejemplo la aproximación sería 


10.38 - 1938 - 10.41 
1 [30?-— 1) +22? — 19/2222? 1) 1997 Ñ 


La Ji cuadrada crítica (tabla) con 2 grados de libertad y a: = 0.05 es igual a 
5.99, como la Ji cuadrada calculada es 10.41 mayor que Ji crítica se rechaza la 
hipótesis nula. 


CAPÍTULO 


13 


Análisis multivariado 


13.1 INTRODUCCIÓN 


En los últimos años, con el avance del cómputo, se ha mostrado mucho interés 
en las inferencias estadísticas y en las técnicas de análisis de datos por grupo o 
más de dos variables, Se han desarrollado paquetes especiales de cómputo, y se 
han escrito artículos y libros sobre el uso y aplicación de los análisis multivaria- 
dos. Este tipo de análisis se ha aplicado en industrias, gobierno y empresas para 
estudiar la relación de varios fenómenos al mismo tiempo. El análisis multiva- 
riado ha permitido conocer eventos y problemas complejos de la administración, 
tales como el comportamiento de trabajadores, empleados, clientes, desarrollo 
de modelos multidimensionales, de estrategias de evaluación de inversión, mo- 
delos de auditoría, evaluación de cuentas por cobrar, evaluación de empresas, 
pronóstico de la demanda y ocurrencias de ciertos fenómenos, etcétera. Hay 
pocos casos en los que simplemente dos variables se influyen o se relacionan. Es 
por esto que algunos autores creen que muchos estudios sin aplicación de análi- 
sis multivariado quedan incompletos. 

En este capítulo se explica la importancia y el uso del análisis multivariado. 
Se explican brevemente algunos métodos y su aplicación, tales como: regresión 
múltiple, análisis discriminante, análisis factorial, análisis canónico, análisis 
conglomerado y escala multidimensional. 


13.2 ¿QUÉ ES EL ANÁLISIS MULTIVARIADO? 


El análisis multivariado, definido en términos generales, son todos aquellos 
métodos estadísticos que simultáneamente analizan más de dos variables. El 
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análisis multivariado es una extensión del análisis univariable (análisis de la dis- 
tribución) y del análisis bivariable (clasificación cruzada de los datos, co- 
rrelación y regresión simple). 

Algunos autores definen el análisis multivariado como aquel que examina 
más de dos variables! , y otros como aquel que tiene más de dos variables con 
una distribución normal multivariada. Pero según Hair y Anderson?, en el análi- 
sis multivariado todas las variables deben de ser aleatorias y relacionadas de tal 
forma que no sea posible conocer sus diferencias por separado. Entonces, se 
puede deducir que el análisis multivariado es para medir, explicar y/o predecir el 
grado de relación entre variables. 

Se conocen dos tipos generales de análisis multivariado, 


13.21 Los métodos funcionales 


Son aquellos métodos que sirven para pronosticar y explicar fenómenos con el 
conocimiento de otros que se relacionan con ellos. Son métodos que permiten al 
investigador indicar la dirección y magnitud de las relaciones. 

Según la naturaleza y el número de fenómenos que el investigador busca 
explicar hay varios métodos, los cuales se explican a continuación: 


1. Regresión múltiple. Su objetivo es predecir el cambio de la variable 
dependiente como respuesta de las variables independientes; dicho obje- 
tivo se puede alcanzar con el método de mínimos cuadrados que se apli- 
can al resolver la regresión múltiple. (Más adelante se explica con más 
detalle en este capítulo.) 

Ejemplo: se puede predecir la venta de una empresa (variable 
dependiente), según la información respecto a los gastos de publicidad, 
número de vendedores, número de tiendas, precio de su producto, 
etcétera (variables independientes). 

2. Análisis discriminante múltiple. Es un método en el que la variable 
dependiente se debe clasificar en varias clases, cuyo objetivo principal es 
encontrar la diferencia entre ellos y predecir la probabilidad de que una 
entidad de la población (individuo u objeto) pertenezca a una clase par- 
ticular. Ejemplo: clasificar al usuario y no usuario de ciertos servicios 
públicos, según su edad, estado civil, sexo, ingreso, empleo u otras ca- 
racterísticas, 

3. Análisis de varianza múltiple. En este método se puede analizar el 
impacto de varios factores experimentales en diferentes fenómenos, es 
decir, este método puede explorar simultáneamente la relación entre 
varias variables independientes categóricas (norninales) y dos o más 
variables dependientes. Por tanto, se puede decir que el objetivo de este 


l Maxwell Albert, Etnest, Multivariante analysis in behavioural research, Richard Clay Ltd. 
Londres, Gran Bretaña, 1975. 

2 Hair, Joseph, Anderson, Ralph. Tartham, Ronald y Grablowsky, Bernie, Multivariante analysis, 
Petroleum Publishing Co., Tulsa, Oklahoma, U.S.A., 1979. 
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análisis es encontrar la diferencia significativa en un conjunto de va- 
riables al efectuar cambios en uno o más factores causales. Por ejemplo: 
el incrementar en 100% el personal de control de calidad, puede incre- 
mentar significativamente la calidad de la producción. 

Se puede aplicar el análisis múltiple de covarianza junto con el 
análisis múltiple de varianza, como un complemento para eliminar el 
efecto de las variables independientes no controladas. 

4. Análisis de correlación canónica. Es un método similar al de la regresión 
múltiple con la diferencia de que aquí se pueden analizar simultánea- 
mente varias variables dependientes e independientes. La idea principal 
es desarrollar combinaciones lineales entre cada conjunto de variables 
independientes y dependientes, de tal manera que se maximiza la co- 
rrelación entre los conjuntos. Es decir, el procedimiento implica determi- 
har una serie de pesos para las variables dependientes e independientes, 
en forma tal que proporcione la máxima correlación simple. Ejemplo: el 
estudio de la naturaleza y magnitud de la competencia del precio del pro- 
ducto, entre varias marcas. 


13.2.2 Métodos estructurales 


Son aquellos métodos multivariados que sirven para reducir datos y simplificar 
las relaciones complejas, de tal manera que permitan al investigador conocer 
rnás a fondo las relaciones y las estructuras de las variables. Estos métodos son 
más descriptivos y menos predictivos. Los métodos multivariados de este grupo 
son los mostrados en la figura 13.1: 


1. Análisis factorial. Es un modelo estadístico que permite analizar la in- 
terrelación entre un número de variables y explicarlas en términos de un 
factor común, En otras palabras, es una manera de explicar la correlación 
entre un grupo de variables, considerando la existencia de factores co- 
munes que influyen sobre ellas. El análisis de factores tiene dos objetivos 
principales: 

1.1 Resumir la información contenida en un conjunto de variables en 
función de otro menor. Las nuevas variables se denominan factores. 

1.2 Explicar un fenómeno complejo en función de unas cuantas variables 
o factores. 

2. Análisis de conglomerados. Es una técnica analítica que se puede aplicar 
para clasificar objetos o individuos en grupos homogéneos, con base en 
alguna similitud existente entre ellos. Entonces, el objetivo principal de 
este análisis es la clasificación de un grupo de datos en segmentos basán- 
dose en algunas normas estadísticas o juicios personales del investigador. 
Hay varios algoritmos para el análisis de conglorrierados, pero sólo 
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algunos tienen las propiedades de inferencias, estadísticas. Por tanto, se 
puede considerar que este análisis es una técnica, de clasificación. ? 

Ejemplo: segmentar o dividir a los clientes de un banco con base en 
los diferentes beneficios que buscan. 

3. Detección de interacción automática (AID). Cuando el analista de mer- 
cadotecnia se enfrenta a una gran cantidad de datos sobre muchas variables 
y no puede desarrollar un modelo de regresión, AID constituye una técnica 
útil en la búsqueda del modelo que se ajuste mejor a los datos. AID ayuda a 
identificar las variables independientes importantes, detectar si existen rela- 
ciones lineales y a descubrir si hay interacción entre las mismas. 

Una característica muy importante de esta técnica es la de permitir 
identificar las interacciones, las cuales pueden ser muy relevantes y a la 
vez difíciles de detectar, especialmente si se trata de un problema con 
muchas variables. Una interacción se presenta cuando el efecto de una 
variable depende del efecto de la otra. 

Por ejemplo: los gastos de publicidad pueden influir en las ventas 
cuando la calidad de los anuncios es alta, pero pueden no influir de 
ninguna manera si el enfoque de los anuncios no es bueno. La interac- 
ción puede detectarse graficando los gastos de publicidad y las ventas 
cuando los anuncios son buenos y cuando son malos, también puede 
detectarse mediante tabulaciones cruzadas de los datos. Sin embargo, el 
uso de los métodos gráficos y de las tabulaciones cruzadas se vuelve 
difícil, si no imposible, cuando se trata de problemas con un gran núme- 
ro de variables que implican varias interacciones posibles. En estos casos 
AID resulta mucho más adecuada. * 

4. Análisis conjunto o análisis de permutas múltiples. El análisis conjunto 
permite ordenar la importancia relativa que tengan los atributos multidi- 
mensionales de un producto. Esta técnica se inicia con las opiniones 
globales que tengan los consumidores respecto a una serie ide alternati- 
vas complejas. De ahí, ordena las evaluaciones originales en escalas de 
utilidad, separadas y compatibles, mediante las cuales las opiniones glo- 
bales originales (u otras que comprendan nuevas combinaciones de atri- 
butos) puedan ser reconstituidas. 

El objetivo del análisis de permutas es determinar en el caso de cada 
consumidor: 1) la importancia relativa de cada uno de los diversos atri- 
butos que componen un tipo dado de producto, 2) la deseabilidad de ca- 
da “nivel” o condición de cada atributo, 3) la combinación óptima de 
niveles o condiciones de atributos en un “paquete” (producto) que es el 
ideal dentro de las limitaciones tecnológicas y de precio. 


3 Ziff, Ruth, Psychographics for Market Segmentation, Journal of Advertising Ressearch, abril, 
1971, pp. 3-10. 

4 Paredes, Ana María, El análisis multivariado en la investigación de mercadotecnia. Tesis para el 
grado de Maestría en Administración, F.C.A., UNAM., México, 1982, p. 76. 
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El análisis de las permutas es más adecuado en el caso de productos 
donde los consumidores quisieran obtener tanto de cada nivel de un 
atributo como fuera posible, pero donde las limitaciones (usualmente 
costos) les obligan a permutar. 


Procedimiento 


Se han elaborado diversos procedimientos para conocer las funciones 
de utilidad de los consumidores en relación a los atributos y los niveles de 
atributos. Los dos métodos que más se usan son los arreglos ortogo- 
nales y las comparaciones de permutas por pasos. 


En general, los pasos por seguir al efectuar un análisis conjunto son: 


a) Preparar una lista de los atributos del producto considerados impor- 
tantes. 

b) Definir diversos nivites o condiciones de cada atributo. 

c) Seleccionar un diseño experimental que proporcione diversas combi- 
naciones de estos niveles o condiciones, y que se presentará a los 
consumidores. Estas combinaciones proporcionan la base para los jui- 
cios de la “permuta”. 

d) Solicitar una muestra de encuestados que ordenen por categorías sus 
elecciones respecto a estas combinaciones de niveles de atributos. 

e) Calcular las funciones de utilidad mediante programas de computado- 
ra (opcionales) que buscan una serie de valores de escala de cada 
atributo que, una vez sumados para poder producir el valor de utili- 
dad total, corresponderán a las clasificaciones de la evaluación glo- 
bal, de manera tan estrecha como sea posible. Algunos de los progra- 
mas más simples son formas modificadas del análisis de regresión. 


. Escala multidimensional. Este método estadístico permite al investigador 


conocer el criterio o las dimensiones que la gente utiliza para formar sus 
percepciones acerca de la similitud y preferencia entre varios productos o 
servicios. 

Las escalas multidimensionales se basan en el supuesto de que los 
individuos visualizan un estímulo en función de la posición con respecto 
a un conjunto de atributos. El objetivo principal de este modelo multi- 
variado es graficar las alternativas en espacio multidimensional de ma- 
nera que sus posiciones relativas en el espacio reflejen la similitud 
percibida entre alternativas. La razón para emplear este enfoque indirec- 
to, radica en que en muchos casos el entrevistado desconoce las dimen- 
siones o atributos o bien éste no puede precisarlo; ejemplo: en función de 
qué atributos evalúa usted un automóvil o el entrevistado no está dis- 
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puesto a contestar en forma precisa; ejemplo: ¿por qué grita a sia subordi- 
nado? A 
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Para seleccionar un modelo estadístico multivariado, primero hay que contestar 
las siguientes dos preguntas: 


1. ¿Existe una variable dependiente? 


SÍ NO 


¿Cuántas variables dependientes hay? 


A — Una sola 
B - Varias. 


2. ¿Cuál es el nivel o la escala de los datos? 


A - Métrica 
B — No métrica, 


Según las respuestas a estas preguntas, es decir, según la naturaleza de los 
datos, el modelo de análisis multivariado cambiará, por ejemplo: si hay una 
sola variable dependiente y varias variables independientes; y si la variable 
dependientes es métrica (escala intervalar o racional), se puede aplicar regre- 
sión o correlación múltiple. Si la variable dependiente no es métrica, es decir, 
es clasificatoria (escala nominal u ordinal) se usa análisis discriminante múlti- 
ple. Si hay varias variables dependientes, y éstas son métricas, se aplica el 
análisis de la varianza y de la covarianza múltiple o análisis canónico. Si las 
variables dependientes no son métricas se puede usar el análisis canónico, pero 
con la aplicación de variables “dummy” para convertir las variables depen- 
dientes no métricas a métricas. 

En el caso de que nuestros datos no estén clasificados como dependientes e 
independientes, los modelos del análisis multivariado pueden cambiar. Si los 
datos son métricos se utiliza el análisis de factores, el de conglomerado, o 
escalas multidimensionales métricas. Cuando los datos no son métricos se puede 
aplicar el análisis de escala multidimensional no métrica. La figura 13.1 ilustra 
esto con claridad. 
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13.3.1 Aplicación de los análisis multivariados en contaduría 
y administración 


Por lo general, en una organización hay cuatro tipos de necesidades de realizar 
investigaciones: 


1. Estudios de diagnósticos. En este estudio el administrador busca conocer 
la situación actual de su organización. 

2. Estudios de pronósticos. En éste, se trata de pronosticar la situación de su 
organización en un futuro próximo. 

3. Estudios estratégicos. En éste se busca información acerca del impacto 
que causarán unos posibles cambios en las actividades de la organización; 
por lo general, este tipo de estudio se realiza por medio de experimentos 
en el campo, en los laboratorios, o de modelos de simulación. 

4. Estudios estadísticos. Estos estudios son para asegurar la calidad y canti- 
dad de los datos y determinar el grado de sesgos entre ellos. Estos estu- 
dios se ocupan del error muestral, del ajuste de los datos y de minimizar 
el sesgo. 


En la tabla 13.1 se observa la relación de cada estudio con el método 
estadístico multivariado más apropiado. En este capítulo se explican con más 
detalle los análisis multivariados. 


13.4 REGRESIÓN MÚLTIPLE 


La regresión múltiple es el método estadístico multivariado más conocido. Es un 
método que permite encontrar la relación entre una variable dependiente y una 
serie de variables independientes. La regresión múltiple se puede considerar 
como un modelo descriptivo el cual sirve para la predicción encontrando la 
mejor ecuación lineal o encontrando una ecuación que determina la contribución 
de una variable específica o un conjunto de variables, o se puede considerar 
como un modelo de inferencias que servirán para prueba de hipótesis, es decir, 
que puedan evaluar los valores poblacionales por medio de los datos muestrales. 

Para entender el papel descriptivo de la regresión múltiple, suponga que los 
directores de una cámara de la industria quieren predecir o prever la condición 
de liquidez de las empresas afiliadas después de una devaluación del 100% (la 
variable dependiente), con base en las variables independientes de deudas inter- 
nas, deudas externas, costo fijo y participación del mercado. Por medio de la 
regresión múltiple, el director de la cámara puede obtener una ecuación que 
indique cómo pueden evaluar las puntuaciones de las variables independientes 


$ Todas estas variables deben tener por lo menos un nivel intervalar, a través de la aplicación de la 
variable “dummy” se puede lograr esta condición. Para mayor información se puede consultar, 
Neter, John y Wasserman, William, Applied Linear Statistical Models, IRIOIN, INC. Hornewood, 
linois, 1974. 
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Tabla 13. 1 Relación entre tipos de estudios y el análisis multivarlado. 


Necesidades de investigación 


Métodos multivariados 


1. Estudios para diagnósticos 
a) En qué situación estamos 
b) Percepción de otros de nuestra 
organización 
c) Preferencia de nuestros clientes 


d) Segmentar el campo de nuestras 
actividades. 


Análisis de factores y evaluación de 
conglomerados 
Escala multidimensional 


Análisis de conjuntos o de permutas 
múltiples 

Análisis de factores y análisis de con- 
glomerados. 


2. Estudios para pronósticos 
a) Predecir la demanda de productos 
O servicios 
b) Potencialidad de la organización. 


Regresión múltiple y la correlación 
canónica 
Análisis discriminante múltiple. 


3. Estudios estratégicos. 
a) Experimentos 
b) Simulaciones. 


Análisis de varianza o análisis dis- 
criminante. 
Análisis de varianza o análisis dis- 
criminante. 


4. Estudios estadísticos 
a) Reducción de datos cuando son 
muy heterogéneos 
b) Errores de medición 


£) Consistencia de los datos 
d) Distribución normal. 


Análisis de conglomerado y de fac- 
tores 

Análisis de factores o la escala multi- 
dimensional 

Análisis de factores 

Análisis sde factores. 


para presentar la predicción de la condición de las empresas afiliadas a la cámara 
después de dicha devaluación. 

El director también obtendrá estadísticas, que le indicarán qué tan exacto es 
su modelo y cuál es la variación en las condiciones de liquidez de las empresas 
afiliadas, estando explicada por el conjunto de las cuatro variables indepen- 
dientes. Además si el director desea simplificar su ecuación, encontrará aque- 
llas variables que no contribuyen mucho a la predicción y las eliminará. La 
regresión, múltiple proporciona información para dichas decisiones. 

En vez de predecir, el director de la cámara puede estar interesado en exami- 
nar la relación entre la variable dependiente y una variable independiente en par- 
ticular, como por ejemplo la influencia de las deudas externas de la empresa en la 
condición de líquidez. Con la regresión simple se puede encontrar esta relación, 
pero la regresión múltiple le da muchos coeficientes parciales, porque puede ver el 
impacto de la deuda externa mientras que las otras variables independientes están 
en la ecuación. 
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Además, se puede usar la regresión múltiple para apoyar la teoría de causa- 
lidad. Aquí la idea es describir la relación entre las variables dependientes e 
independientes en su totalidad como apoyo de la consecuencia lógica de la 
estructura del modelo que se estructuró con base en la teoría de causalidad. 

La regresión múltiple, como un modelo estadístico para inferencias, sirve 
para estimar los valores poblacionales (parámetros) a través de examinar la 
observación muestral. Por ejemplo, el investigador puede estimar el coeficiente 
de regresión de la población por medio de los datos muestrales con cierto nivel 
de intervalo de confianza. También se pueden probar hipótesis, en este caso, el 
investigar en lugar de estimar los parámetros, simplemente trata de probar la 
hipótesis nula cuyo valor es igual a cero contra la hipótesis alterna cuyo valor es 
mayor o menor que cero. Las hipótesis más comunes en la regresión son: 


1. No hay relación lineal entre variable dependiente y un conjunto de va- 
riables independientes, por ejemplo: la liquidez de las empresas afiliadas 
a la cámara no depende de las variables; como deudas internas y exter- 
nas de la empresa, costo fijo y participación del mercado. 

2. Una variable independiente x no tiene relación lineal con la variable 
dependiente; por ejemplo, no hay relación entre liquidez y deuda exter- 
na; la relación observada es por fluctuaciones muestrales. 

El modelo de la regresión múltiple es: 


Y=a+bix + ba + ba == + bnan 


en donde 
a = El valor de Y cuando todos los X”s son cero, 
b1 = La coeficiente de regresión asociada con cada unidad de X1. 


13.4.1 Interpretación de los coeficientes de la regresión 


El coeficiente de la regresión, por decir, b, en la ecuación y = a + b, X, + b7X», 
indica el cambio esperado en Y con un cambio de una unidad en X, cuando la 
variación de X, sea controlada. 

También la interpretación combinada es importante, es decir, la variación de 
Y, cuando x, Y X> cambian una unidad; entonces el cambio esperado en Y sería 
(b1 +b2). 

Se pueden interpretar los coeficientes parciales, o sea, encontrar el cambio 
en Y causado por una unidad de cambio en b,, controlando las variaciones de 


baby. 
13,4.2 Prueba de significación 


Para determinar si existe relación entre variables dependientes e independientes 
en un análisis de regresión múltiple, es necesario probar la significación del 
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modelo de regresión. Si se encuentra que hay relación, la significación se debe 
evaluar. 


13.43 Prueba estadística 


El coeficiente de la correlación múltiple R se usa para probar la significación 
estadística del modelo de regresión en su totalidad. Se sabe que la variación total 
O suma cuadrada en Y se puede dividir en dos partes: una parte se puede explicar 
con la regresión y otra parte se queda sin explicación, o sea: 
Suma cuadrada de Y = Suma cuadrada de la regresión + suma cuadrada dei 
residual. 


LT? = 1 V-YP +2 Y YP 


La estimación del mínimo cuadrado garantiza que —la variación residual en 
la variable dependiente Y se puede minimizar cuando se pretende predecir usan- 
do la ecuación de regresión. Ei valor predictivo y el valor residual (y — y) serán 
mutuamente independientes. Entonces, la proporción de la variación de Y que 
puede explicar el modelo de regresión en su totalidad se puede examinar con el 
cuadrado del coeficiente de la correlación múltiple. 


— Suma cuadrada Y — Suma cuadrada residual 
Suma cuadrada Y 


re 


— Suma cuadrada de regresión 
Suma cuadrada Y 


La variación en Y, explicada con la influencia lineal 
— Combinada de las variables independientes 
Variación total en Y 


Tanto el coeficiente de correlación múltiple R como el coeficiente de deter- 
minación R? tienen un rango de O a 1.0. 

Las hipótesis específicas explicadas anteriormente que se pueden probar 
para examinar la significancia estadística serían: 


Ho: bi=b3=-*-=Bk=0 
H4¿: No todos bs son = 0 


La prueba que se usa aquí es la estadística F y en general se puede calcular 
F como la razón de los cuadrados de las variables y cada una con un grado de 
libertad asociado con él. 


F = Xi (grado de libertad 1) X3 (g. de L. 2) 
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La regla de decisión para la prueba de significancia, es 


Si F calculado < PF valor crítico (tabla), aceptamos Ho. 
Si F calculado > F valor crítico (tabla), rechazamos Ho. 


Se puede calcular F' usando la fórmula 


Suma cuadrada de regresión/K 
Suma cuadrada residual(N — K— 1) 


6 
Pz RYK 
(1= RD K= 1) 


donde: 


K = número de variables independientes. 
n = tamaño de la muestra. 


La prueba F sólo indica que si existe una relación; estadísticamente no pro- 
porciona información para evaluar la significancia sustantiva, o el grado de las 
relaciones entre las variables. La significancia sustantiva o grado de relación se 
mide con el coeficiente de determinación múltiple. 

Cuando se está evaluando la significación sustantiva del modelo de regre- 
sión, el investigador debe considerar explícitamente la relación entre el número 
de variables y el tamaño del muestreo. Cuando el número de variables (K) se 
acerca al tamaño del muestreo N, R? se acercará a uno (1.0). Si el número de 
variables es igual al número de casos, R? sería igual, a 1.0 donde se presenta una 
relación perfecta. En efecto, para K variables y N tamaño de muestreo el R? 
esperado es: 

2 =K 1 
R” esperado NA 


Debido a la existencia de esta relación, aunque la hipotésis nula sea correc- 
ta, R? exagerará la relación si la tasa del número de variables al número de casos 
es relativamente grande. Por estas razones, frecuentemente se ajusta la R?. La 
fórmula que se usa comúnmente para el ajuste de R? es: 


1 


R=l-(1- 
R=1-(1 Di 
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donde: 


R? es el coeficiente de determinación ajustada,é para minimizar el efecto de 
exageración de R?, 


Se deben tener cuatro veces más casos que variables, es decir, el tamaño del 
muestreo debe de ser cuatro veces más grande que el número de variables. 

Como la esencia del análisis de regresión está basado en el análisis de va» 
rianza se puede usar la tabla de ANOVA para calcular F, R y R?, es decir, por 
medio de los resultados de dicha tabla se pueden probar las hipótesis y evaluar el 
modelo, la tabla ANOVA que se presenta a continuación es la que se usa en 
análisis de regresión, 


Tabla 13,2 Tabla de ANOVA. 


Fuente de 
variación 


F 
calculada 


Suma 
cuadrada 


Regresión 
(XL, X2 — XK) k SC(b1,b2, — bkib0) | SC Regresión | SC Regresión 
K E 


Regresión 
(b1, b2 — bk150, 


YX 


CME = SCE 
n—=(k- 1) |SCE = Y! Y - Y! Xb =8 
N=(K+1D 


n-1 SCT =Y- YP)ln 


13.44 El valor de la importancia relati 


Hay dos etapas de evaluación de la importancia relativa de las variables inde- 
pendientes que también se le conoce como variable predictor. 

En la primera etapa se debe determinar cómo y cuántas variables se deben 
incluir en el modelo. 

En la segunda etapa se debe determinar la importancia relativa de las va- 
riables independientes que se quedan en el modelo. 


$ McNemar, Quinn, Pshychological statistics, Nueva York, John Wiley, 8: Sons, 1969, pp. 205-206. 
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1. Etapa, ¿Cuántas variables independientes? Hay dos formas de iniciar con 
ciertas variables independientes, una es basarse en la teoría, o incluir un 
gran número de posibles variables independientes y después sistemática- 
mente eliminar las variables que no explican el modelo. Al quitar las 
variables independientes aumenta la validez y confiabilidad de las prue- 
bas estadísticas que se realizan con los datos y permiten hacer una mejor 
interpretación. 


Hay varias formas para reducir un número grande de variables indepen- 
dientes potenciales a una serie más manejable. Una forma es relacionar cada 
variable independiente con la variable dependiente por separado y considerar 
aquellas variables en el modelo que tienen una relación estadísticamente signi- 
ficativa. En este caso se utiliza la razón de correlación para encontrar va- 
riables significativas. El método es sencillo pero no considera posibles interac- 
ciones entre variables independientes. 

Otra forma de reducir variables independientes es aplicar el análisis de fac- 
tores o el análisis de componentes principales, y así por medio de estos modelos 
encontrar las variables independientes significativas. Después, estas variables se 
pueden usar en un análisis de regresión para medir su relación con la variable 
dependiente. 

El procedimiento teórico es realizar un análisis de regresión con todas las 
posibles combinaciones de las variables independientes y usar aquellos modelos 
de regresión con un valor de coeficiente de determinación ajustado R? . Este pro- 
cedimiento ofrece varios beneficios. 

Presentará que diferentes combinaciones de las variables independientes 
producen un valor de R? idéntico. Además, permite ajustar el modelo y conocer 
aquellas variables que indirectamente ayudan al mejoramiento del modelo y a 
incrementar el valor de R?.? 

Este procedimiento tiene una desventaja; no es muy práctico cuando el 
número de variables independientes es grande. Por ejemplo, cuando hay (27 — 1) 
combinación de m variables para cuatro variables independientes, se tendrán 15 
combinaciones; no sólo necesita tiempo y recursos económicos el realizarlo, 
sino también tiempo para interpretar. 

Para que las variables independientes en el proceso de selección sean más 
eficientes, el investigador puede determinarlas por medio de Stepwise, análisis 
de regresión. 

Hay dos formas de regresión Stepwise. La técnica de incrementar o hacia 
adelante, en donde el investigador empieza con cero variables independientes y 
progresivamente aumenta cada vez una variable al modelo según algunos crite- 
rios estadísticos. En la técnica de disminuir, o hacia atrás de la regresión de 
Stepwise, el investigador empieza con todas las variables independientes en el 


7 Zedeck, Sheldon, “Problems with the use of moderator variables Psycological Bulltien, octubre, 
1971. pp. 295-310. 
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modelo y sucesivamente elimina las variables independientes según algunos cri- 
terios estadísticos. Otra técnica consiste en una combinación de las técnicas de 
disminuir e incrementar en donde se eliminan y aumentan variables en cualquier 
etapa en el proceso del análisis de regresión “Stepwise”. 

Matemáticamente explicado, sería en la siguiente manera: supóngase que se 
tiene un modelo con tres variables independientes: Xy, X2, X3 y se desea conocer 
la siguiente información 


1. SC(biL, bp) = SC(X): La SC resultante de usar únicamente X| para prede- 
cira Y. 

2. SC(b21, ba, by) = SC (X21, Xy): La SC extra explicada por X> en adición a 
X¡ para predecir a Y. 

3. SC (Bal, Bo, Bi, Ba) = SC(X31, Xy, X2): La SC extra explicada por Xz en 
adición a X) y X> para predecir a Y 


La información anterior se requiere para dar respuesta a las siguientes pre- 
guntas: 


1. ¿Contribuye significativamente X| a predecir a Y? 

2. ¿Contribuye significativamente la adición de Xz a predecir a Y después 
de haber tomado en cuenta la contribución de X/? 

3. ¿Contribuye significativamente la adición de X; a predecir a Y después de 
haber tomado en cuenta a la contribución de X| y X¿? 


Ahora se sabe cómo contestar la pregunta 1, ya cue solamente implica el 
ajuste de un modelo de R£S. Para contestar las preguntas 2 y 3, se usarán las 
pruebas de F parciales. Para realizar una prueba de F parcial para una variable, 
digamos X*, 

Dado que las variables Xy, X>, ..., Xp ya se encuentran en el modelo, se debe 
calcular la “SC extra resultante de adicionar al modelo X*, dado que ya se 
encuentran en el X/ , X2, ..., Xp”. Esta suma de cuadrados se calcula mediante la 
fórmula. 


SC extra de adicionar = SC de regresión — SC de regresión X * dado 
XX... Xp 


Cuando Xy, X>..., Xy y X * se encuentran todos en el modelo. 
SC de regresión cuando X1 , X>, ..., X, (y no X *) están en el modelo . 


* Hocking, RR., “The Analysis and selection of variables in linear regression”. Biometrics, marzo. 
1976, pp. 1-49. 
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En forma condensada esto puede escribirse 
SC(X*,1 X1, X2,.... Xp) = SC(X1, X2,..., Xp, X*— SC(X1. X2..... Xp) 

Recuérdese que la SC(X;, X,.... Xp, X*) es la SC regresión resultante de 
ajustar el modelo Y = bp + b1X1+b2X2+...+ biXy + b*X * + € y la SC(X], 
SC(X1, X2 ... Xp) es la SC regresión que se obtiene al ajustar el modelo Y = by + 
biX1, + boX> +... + bpXp + E. Para mayor generalidad suponga que se consi- 
dera el modelo Y = by + b1X] + b7X> + b3X3 + € y se desea calcular la SC(G1, 
X1, X2). Para tal caso se tendrá que ajustar a dos modelos. 

Modelo 1. 

Y =bo+b1X, +b3+b3X3+€ 


o bien matricialmente 


Y=X¡Br. +e 
donde 
1X11 X21 31 
bo 
1Xu Xan X 
X= yb= 1 
ba 
1X 1 X2n X3n ES 
En este caso 
SC regresión = SC(X], Xo, X3)= Y X (MX 1X, Y. 
Modelo 2. 


Y = bg+ b1X1 + boX> 


el cual, escrito matricialmente es 
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donde 
1X11 X21 
bo 
XX 
X= ym= b1 
ba 
1X1n Xan 


En este caso 
SC regresión = SC(X1, Xo) = Y X3 (8, Xo)”! X2Y 
Por lo tanto, 


SC(X31, X1, X2) = SC (X], X2, X3) — SC(X¡X2) = 
Y XX)" Xx Y — Y XX)” 1XoY. 


Se desea probar la hipótesis nula 
Ho: La adición de X* al modelo que ya contiene a las variables. 
X1,X2,.. +, Xx NO mejora significativamente la predicción de Y. 


La estadística de prueba es 


SUXEL Xy, Xo,..., Xk) 


= Fx La Xp) > 
Fo ERA IX EOS CE Y, o 8) 


Esta estadística tiene la distribución de F con 1 y n — k2 — grados de liber- 
tad a bajo la Ho. Esto es F,=Fl — K— 2,4. 
Nota: El CME (X|, X> ....X¡¿, X%) es el CME que resulta de ajustar el modelo 


Y =bg = biX] +b9X> ..... + Di Xg + DEXF 4 E 

Para facilitar el entendimiento del proceso de selección de variables se van a 
considerar los siguientes cálculos de un problema de tres variables indepen- 
dientes de un muestreo de 15 casos, 

A continuación se presentan los modelos estimados y las tablas de ANOVA 
para varias combinaciones y variables. 


E 
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Modelo 1 (Y, Xy) 
Modelo estimado? = — 0.0878 + 0.5219 X/ 
FEV. gl se CM. F ú 
Regresión AX) 2 10.6952 5.3476 17.0574 0.0005 
Error n 3.7621 0.3135 


Total 14 14.4573 


Modelo 2 (Y, X2) 


Modelo estimadoY = 0.9782 + 0.0379 X> 


F.V. 2d. s.C. CM. F o 
Regresión (X,) I 1.1398 1.1398 1.1126 03115 
Error 13 133175 1.0244 
Total 14 14.4573 

Modelo 3 (Y, X3) 


Modelo estimado? = 1.435 + 0.00063 Xz 


FY. gl s.C. CM. F a 
Regresión (X,) 1 0.6046 0.6046 0.5674 0.5294 
Error 13 13.8527 1.0656 

Total 14 14.4573 


Modelo 4 (Y, X1, X2) 


Modelo estimado f = 0.84448 + 0.5227 X¡ + 0.03994 X> 


EY. 2d. S.C. CM. F a 
Regresión (X,, X) 2 10.9591 5.4796 18.7979 0.0004 
Error 12 3.4982 0.2915 


14.4573 
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Modelo S (Y, X]. X3) 


Modelo estimado? = — 0.4521 + 0.5337 X, + 0.0008 Xz 


FY. el. S.C. CM. F a 
Regresión (XX) 2 10.6952 5.3476  17.0574 0.0005 
Error 1v) 3.7621 0.3135 
Total 14 14.4573 


Modelo 6 (Y, X2, X3) 


Modelo estimado? = — 1.8867 + 0.3422 X» — 0.007 Xz 


PY. gb S.C. CM. F a 
Regresión (X,X) 2 3.5153 1,7577 1.9276 0.187 
Error Y 10.9420 0.9118 
Total mM 14.4573 


Modelo 7 (Y, Xy, X2 X3) 


Modelo estimado? = — 1.9704 + 0.4919 X¡ + 0.1716 X, — 0.003 X3 


EV. gl. sc. C.M. F a 
Regresión (X,, X, Xx) 3 11.3656 3.7885 13.4794 0.0008 
Error 1 3,0917 0.2811 
Total 14 14,4573 


Con las tablas del ANOVA que se presentan se pueden calcular las siguientes 
SC parciales. 

Usando los modelos 1 y 4 se tiene 

SC(Xa, X1) = SC(X1, X2) — SC(X1) = 10.9591 — 9.6971 = 1.262 


De los modelos 4 y 7 se calcula 


SC(X3, X1, X2) = SC(Xy, X2, X3) — SC(X1, X2) = 11.3656 — 10.9591 = 
0.4065 
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Con los modelos 6 y 7 se tiene 


SC(X1, Xa, X3) = SC(Xy, X2, X3) — SC(Xo, X3) = 11.3656 — 3.5153 = 
7.8503 


Con los modelos 5 y 7 es posible calcular 


SC(Xa, Xy, X3) = SC(X1, X2, X3) — SC(X1, X3) = 11.3656 — 10.6952 = 
0.6704, 


A continuación se presentan algunas pruebas de hipótesis que se pueden 
realizar: 


Ho: La adición de Xy al modelo que ya tiene la variable X, NO mejora signi- 
ficativamente la predicción de Y. 


La estadística de prueba es: 


Za - Saxo IX) _ 1262 _ 
FO FOCXDS Cap, xo) 7 02915 


F¡= Fis-4- 2005 = Fraoos = 4.75. 


Como F, = 4,75 > Fc = 4,329 se llega a la conclusión de que la adición de Xz 
al modelo que ya tiene a X, no mejora significativamente la predicción de Y a un 
nivel de significancia del 5%, 


Hy; La adición de X3 al modelo que ya tiene la variable X, y X) no mejora 
significativamente la predicción de Y. 


En este caso. 


SC(X3 | Xy, X2) _ 0,4065 
Fo= F(X3|X,, Xy = alfa = =1 
0= Fl XX CME(X1.Xo Ka) 02811 CO 


F.=PFis-2- 205 = Fiyoos = 4.84. 


Se llega a la conclusión de que la adición de la variable de X3 no aumentará 
la predicción de Y significativamente, 


Ho: La adición de X¡ al modelo que ya contiene a las variable X2 y X3 no 
mejora significativamente la predicción de Y. 
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Para esta hipótesis 


Sc(x1 1%», X3) _ 7.8503 


= = 27.927 
CME(X1, X2X3) 0.2811 


Fe = F(X¡|X,, X5) = 


F,= Fi1oos = 4.84. 


Se deduce que la adición de X| al modelo que ya contiene a X> y Xz mejora 
significativamente (5%) la predicción de Y. El procedimiento de “todas las 
regresiones posibles” consiste en ajustar todos los modelos que resultan de llevar 
a cabo todas las combinaciones posibles de las variables independientes, En par- 
ticular, para este ejemplo tendría por ajustar los siguientes modelos. 


DY=fAXy+E 

2) RXy+e 
3)Y=fX3)+e 

YY =AX,X)+e 

5)Y =AX1,X3)+€ 
6)Y = AX, X3)+e 
7) Y = AX1, Xo, Xa) + € 


En general, para K variables hay que ajustar 2* — 1 modelos. Los resultados 
que se obtienen de ajustar los siete modelos resultantes se presentan en la tabla 
133. 

De la tabla se puede observar que en términos de R? los mejores modelos 
para el caso de una, dos y tres variables son: 


+ Mejor modelo con una variable: 
(1); Y = AX1) = : R? = 0.6707, 
CME = 0.3662 

+ Mejor modelo con dos variables: 
(9) Y = AX], X2) + :R? = 0.7580; 
CME = 0,2915 

+ Mejor modelo con tres variables: 
(DM, Y =AX1, X2, X3) + € R? = 0.7861; 
CME = 0,2811 


De los modelos en consideración evidentemente el mejor es el (4) pues 
difieren en muy poco, tanto en R? (0.7861 — 0.758 = 0.02) y en CME 
(0.2915 — 0.2811 = 0.01) del modelo (7) y tiene mucho mayor R? y menor 
CME que el (1). Por do tanto, con base en el procedimiento de “Todas las 
regiones posibles”, el mejor modelo ajustado es 


Y = — 0.8484 + 0.5253X] + 0.0399X> 
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13.45 Procedimiento de selección hacia atrás 
En este procedimiento se procede como se indica a continuación: 
Paso 1, 


Ajústese un modelo con todas las variables independientes. En el ejmplo el 
modelo ajustado es 


Y=-— 19704+ 0.4919X, + 0.1716X, — 0.003X3, 


la tabla correspondiente de ANOVA es 


FY. gd. S.C. C.M. F, a R? 
Regresión 3 11.3656 3.7885  13.4794 0.0008 0.7861 
(XX, X) 

Error 1 3.0917 0.2811 
Total 14 14,4573 
Paso 2 


Calcúlense las F parciales para cada variable como si ésta fuera la última en 
entrar al modelo, 


Variable F parcial F'11,0.025 
X, dado X, X, 27.9307 1.47 
X, dado X, X, 2.3852 
X, dado X, X, 1.4458 
Paso 3 


Elija la F parcial más pequeña y denótela por F,. En nuestro ejemplo 
FL = 1.4458 
Paso 4 


Compare el valor de F, con un valor crítico seleccionado con anterioridad y 
denótelo por Fo. 


a) Si F, < F, elimine del modelo la variable en consideración. Recalcule la 
regresión para las variables restantes y repita los pasos 2, 3 y 4. 
b) Si F, > F, adopte la ecuación de regresión. 
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En el ejemplo F, = 1.4458 < F, = 1,47 por lo tanto, se elimina la variable X3. 
Recalculando la ecuación de regresión usando X| y X>, se obtendrá 


P = — 0.8448 + 0.5253 X] + 0.399 X. 


La tabla del ANOVA es 
EV. gl 3.C. CM. F, E R? 
Regresión 
y XD 2 10.9591 5.4796 18.7979 0.0004 0.758 
Error 12 3.4982 0.2915 
Total 14 14.4573 
Las F parciales son 
Variable F parcial Fioss 
Xx 33.6854 1.46 
X 4.3299 


Como F, = 4.3299 > Fo = 1.46 se adopta el modelo de regresión ajustado 
al cual incluye a las variables X| y X>. 


13.4.6. Procedimiento de selección hacia adelante 
En el procedimiento de selección hacia adelante se procede como sigue: 
Paso 1. 
Seleccione la variable independiente con mayor correlación con Y y ajuste el 
modelo de regresión lineal simple correspondiente. En el ejemplo se tienen las 
siguientes correlaciones. 
ryx1 = 0.8189; ryx, = 0.2808; ryxz = 0.2045; 
Por lo tanto, la variable a entrar es X;. El modelo de R£S ajustado es 


Y = — 0.0878 + 0.5219X/ 
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y parte de la tabla del ANOVA es 


FY. el CM. F. El R 
Regresión (X,) 1 9.6971 26.4823 0.0004 0.6706 
Error 13 0.3662 
Total 14 


Si el valor de F. no es significativo a un nivel de significancia elegido con 
anterioridad, el proceso termina y se infiere que ninguna de las variables inde- 
pendientes es un predictor importante. 

En este caso la F, es significativa con un Q = 0.025. 

Paso 2. 


Calcule las F parciales para el resto de las variables en modelos que contengan 
esa variable y la seleccionada previamente. En el ejmplo se tendrá. 


F(%| Xy) = 4.3299 
F(X3 | X1) = 3.1839 


Paso 3. 
Seleccione la mayor F parcial y denótela por Fay. Para el ejemplo se tendrá 
Fm = F(X21X1) = 4.3299 

Paso4. 
Pruebe la significancia para la F parcial elegida en el paso 3. 

a) Si es significativa añada la nueva variable al modelo. 

b) Si es no significativa, use el modelo con la variable que se eligió en el 

punto Í. 
En el ejemplo 
Fu = 4,3299 > Fl12005 = 1.46, 


de tal manera que se añade X, al modelo y se ajusta un modelo de regresión con 
las variables X, y X>, éste es, 


Y = — 0.8448 + 0.5253X, + 0.0399X). 
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Paso 5. 


En cada caso subsecuente, determine la F parcial para aquellas variables que no 
están en el modelo y adicione al modelo la variable con el valor de F parcial más 
grande que sea significativa. Si en cualquier paso la F parcial más grande no es 
siguificativa, no se incluyen más variables y el proceso termina. En el ejemplo 
se tiene 


F(X31Xy, Xp) = 1.4461 < F'11, 0025 = 1.47 


Como el valor de la F parcial no es significativo, el mejor modelo es el ajus- 
tado eb el paso 4. 


13.4.7 Procedimiento de selección por pasos 


Es una versión mejorada del procedimiento de selección hacia adelante que per- 
mite la reexaminación, en cada paso, de las variables incorporadas al modelo en 
pasos previos. En cada paso se calcula y se prueba la F parcial para cada variable 
ya incluida en el modelo tratándola como si fuera la variable más recientemente 
incorporada independientemente de cuando entró al modelo. La variable con la F 
parcial más pequeña no significativa (si existe) se elimina, se ajusta un modelo con 
las variables restantes, se obtienen las F parciales y se examinan. El proceso con- 
tinúa hasta que no entren ni se eliminen más variables. En el ejemplo se tiene. 


a) Entra X|. 

b) Entra X2. 

e) Se calcula F(X| lx) = 23.685, la cual es significativa y por lo tanto no 
elimina a X. 

d) Se examina Si Xz debe entrar, la respuesta es NO. El proceso termina, 


13.48 Multicolinealidad 


La multicolincalidad se refiere a una situación en donde algunas o todas las va- 
riables independientes están altamente interrelacionadas. La multicolinealidad 
puede causar problemas en los siguientes aspectos dentro del análisis de regre- 
sión: 

Si existe perfecta colincalidad entre las X”s sus coeficientes de regresión son 
indeterminados y sus errores son infinitos o si la colinealidad es alta, pero no 
perfecta, la estimación de los coeficientes de regresión es posible pero sus 
errores estándar tienden a ser grandes. Por tanto, los valores poblacionales de los 
coeficientes no pueden estimarse de manera precisa. Las formas de detectar la 
colinealidad son: 


1. Cuando R? es muy alto (8 a 1.) pero ninguno o pocos coeficientes de 
regresión son estadísticamente significativos. Cuando R? es alto, quiere 
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decir que la prueba F del análisis de varianza (ANOVA) en la mayoría de 
los casos, rechazará la hipótesis nula de que el valor verdadero de todos 
los coeficientes parciales de la pendiente sean simultáneamente cero, 
independientemente de la prueba. 

2, La correlación simple de los modelos que tienen sólo dos variables inde- 
pendientes, se puede examinar y si esta correlación es alta, la multicoli- 
nealidad existe. 

3. Es recomendable examinar los coeficientes de correlación parcial en caso 
de más de dos variables independientes para detectar la colinealidad 
porque el coeficiente de orden cero (entre dos variables) sería engañoso 
en modelos que tienen más de dos variables independientes. 

4. Cuando el coeficiente de determinación es alto pero las correlaciones par- 
ciales son bajas, posiblemente existe colinealidad, en el caso de que exis- 
ten uno o más variables superfluas. 


Para eliminar el problema de colinealidad existen reglas y métodos seguros, 
a continuación se citan algunos: 


1. Usar información a prioridad 

2. Combinar información de series de tiempo 
3 Omitir una variable altamente colineal 

4, Transformar la información 

5. Obtener información nueva o adicional, 


13.5 ANÁLISIS DISCRIMINANTE 


El análisis discriminante es una técnica estadística multivariada aplicable cuando 
la variable dependiente es nominal (categórica o no métrica), y las variables inde- 
pendientes son métricas. En muchas ocasiones, en el campo de la Administración 
y Contaduría uno se enfrenta a variables categóricas tales como: en las cuentas 
por cobrar los que pagan a tiempo y los que no pagan a tiempo: compradores y no 
compradores de un producto o marca; usuarios y no usuarios de ciertos servicios; 
los trabajadores que faltan y los que no faltan a sus labores, etcétera. En el análi- 
sis discriminante, la variable dependiente puede tener dos o más categorías; en el 
primer caso se le denomina como análisis discriminante múltiple. 

El objetivo del análisis discriminante es encontrar una continuación lineal 
entre dos o más variables independientes que discriminen mejor entre dos o más 
grupos como variables dependientes. Se logra la ecuación lineal con el método 
del cuadrado mínimo de la varianza considerando la varianza intergrupo e intra- 
grupos (error) y como regresión se expresa la razón de estas dos varianzas. Se 
puede derivar la combinación lineal del análisis discriminante mediante la si- 
guiente ecuación: 


D=WIXI + W2X2 + W3X3 +->-- + WnXn 
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donde: 


D = Puntuaciones o valor discriminante. 

W = Es el peso o coeficiente discriminante (como b es en el análisis de 
regresión). 

X = La variable independiente. 


La función discrimina en forma máxima a los miembros de] grupo, e indi- 
ca a cuál grupo probablemente pertenece cada miembro. En otras palabras la 
función discriminante permite hacer la mejor predicción en cuanto a los míni- 
mos cuadrados de la afiliación “correcta” al grupo de cada miembro de la 
muestra. A partir de las puntuaciones de dos o más medidas, se calcula la me- 
jor puntuación de los mínimos cuadrados cuanto mayor sea el coeficiente de 
determinación (R? = variación aplicada/variación total), mejor será la predic- 
ción de pertenencia a un grupo. 

El análisis discriminante se puede utilizar en dos formas principales: 


1. Como método de clasificación y diagnóstico, 
2. Para estudiar la relaciones entre variables de diferentes poblaciones y 
muestreos. 


Quizá el primer uso es más común; por ejemplo, el conocer a los usuarios y 
no usuarios de cierto producto o servicio, el éxito o fracaso de cierto grupo de 
administradores, el estar satisfecho e insatisfecho, etcétera. 

En el segundo caso podría tenerse como ejemplo el siguiente: suponiendo 
que se tienen las calificaciones de unos administradores sobre su rendimiento 
administrativo, y que se ha apreciado por medio de la prueba que son impor- 
tarites tres tipos de ejecuciones o rendimientos (denominados factores)ó, Se 
desea saber cómo resolvieron las tres pruebas los administradores exitosos y los 
que fracasaron, con base en un criterio independiente que está formado por los 
siguientes elementos: capacidad para trabajar con los demás (X1), motivación 
para el trabajo administrativo ( X2) y habilidad profesional (X3 ). 

Suponga que la ecuación de discriminación fue .09X] + .82X, + .50X3. A 
partir de esta ecuación se llega a la conclusión de que la capacidad de trabajar 
con los demás parece que no tiene mucha importancia en comparación con las 
otras dos variables, 

En otras palabras, la ecuación discriminante da un “perfil” de la diferencia 
entre los administradores que tendrán éxito y los que fracasarán. 


3 Griffiths, D., Hemphill, J. y Frederiksen, N. Administrative performance and personality, Nueva 
York: Teachers College Pres, 1962. 
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13.5.1 Suposiciones básicas 


Los datos deben de pertenecer a dos o más grupos mutuamente excluyentes. Las 
unidades de estudios pueden ser: personas, países, animales, la economía en di- 
ferentes épocas, etcétera. 

El análisis discriminante es un modelo estadístico muy amplio en el que en 
determinado estudio, el investigador no usa toda la potencialidad de dicho análi- 
sis. La simplificación de nuestra explicación solamente se basa en las dos expli- 
caciones ya mencionadas que son: la clasificación y la relación o interpretación. 
Frecuentemente se usa el análisis discriminante para ambas, la interpretación y 
la clasificación. 

Las características que se usan para distinguir entre grupos se denominan 
“variables discriminantes”. Estas variables deberán ser intervalares o racionales 
(métricas) para que se pueda determinar la media y la varianza que se deben uti- 
lizar en las ecuaciones matemáticas. 

Las variables discriminantes no pueden tener combinación lineal entre ellas. 
Una “combinación lineal” es la suma de una o más variables. No se puede usar 
la suma o el promedio de las variables si hay variables con correlación perfecta 
(precisamente para eliminar el aspecto de colinealidad que se vio en regresión 
múltiple), 


+ La matriz de covarianza en cada grupo debe ser igual. 
+ Cada grupo se debe extraer de una población con la distribución normal 
multivariada. 


13.52 Función discriminante canónica 


Para estudiar la naturaleza de la diferencia entre grupos, se debe conocer y saber 
interpretar la función discriminante canónica. 

La función discriminante canónica es una combinación lineal de las varia- 
bles discriminantes que fueron formadas para satisfacer ciertas condiciones. 


Dim = Wo + Wi X 1km + Wz X 2lan + Wp X pKm 
en donde: 
Dim = Puntuación de la función discriminante canónica para el caso m 
en el grupo k. 


Xikm = Valor de la variable discriminante Xi para el caso sm del grupo k. 
Wi Coeficiente que produce características deseables en la función. 


Se obtienen los coeficientes (W'S) de la primera función, en forma tal que el 
promedio del grupo sea muy diferente, o sea de maximizar el promedio de la 
diferencia entre grupos. El coeficiente de la segunda función también se deriva 
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de tal manera que maximiza la diferencia entre el promedio del grupo, pero sin 
tener correlación con los valores de la primera función, y así sucesivamente. 

Brevemente se explicará el proceso de derivación de la función discrimi- 
nante. Se recomienda leer el libro de Cooley y Lohnes? a quien desee conocer 
este tema más a fondo. 

Se sabe que para derivar la función discriminante se necesitan algunos 
métodos para medir el grado de diferencias entre los casos (datos). Si se elabora 
una tabla de las medias y desviaciones estándar, no será suficiente, porque no 
indica la interrelación entre las variables, pero se puede usar la matriz de la suma 
de cuadrados total y el de la matriz cuadrada simétrica T, que es un producto 
cruzado de diferencias. 


13 ”rk 
Tj= Y Y Um Ko) (XX J0 
k=l m=1 
donde: 
Número del grupo. 
Número de casos en el grupo k. 


Número total de casos. 
Valor de la variable ¡ para el caso m en el grupo k. 
Media total. 


Los paréntesis ilustran la cantidad de desviación de un caso particular hacia 
la media total. Cuando ¡ = ¡ se están elevando al cuadrado las desviaciones 
estándares, y entonces cada elemento en la diagonal de la matriz es la suma de la 
desviación estándar de la media total, que indican qué tan dispersos están los 
casos a una variable, Cuando ¡ + ¿ se está calculando la suma de la desviación 
estándar de una variable multiplicada a la desviación estándar de otra. 

Todo esto es una manera de medir la correlación (covariación) entre dos 
variables, porque muestra qué tanto una desviación grande de una variable co- 
rresponde a la desviación grande de otra. 


Si se divide cada elemento de Ten (n — 1), se tendrá la matriz de covarianza 
total. Existen discriminantes que usan la matriz de covarianza y otros que usan 
la matriz 7. 


2Cooley, W. W. y P. R., Lohnes, Multivariare data analysis, Nueva York, John Wiley. 

10 Una matriz es un arreglo de números. Usando una sola letra se puede hablar de muchos números o 
elementos de la matriz y de sus propiedades; entonces T es una matriz y tij es un elemento de la 
matriz, cuando ¿ =¿ quiere decir que se está en la diagonal principal como: 
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Para encontrar el grado de relación entre dos variables se puede examinar la 
correlación entre ellas. En este caso, el coeficiente de correlación es más útil que 
la covarianza, porque el coeficiente de correlación es estandarizado en un rango 
de -1 a +1. La matriz de coeficientes de correlación se puede obtener dividiendo 
cada elemento de la matriz 7 por el producto de dos elementos diagonales de la 
matriz en la misma columna y el mismo renglón, Mostrando esto simbológica- 
mente se tiene: 


all al2 al3 alá 
al a2 a3 a 
a31 a32 a3 4 
al 082 a3 a 


Por ejemplo 


all 


Max 


Si el grupo es muy diferente (o sea el promedio de grupos no son idénticos), 
entonces el grado de dispersión dentro de grupos será menor que la dispersión 
total; se puede medir ésta con la matriz del cuadrado medio dentro del grupo o 
la matriz W, se calcula a través de la media de cada bloque o de cada grupo, y la 
fórmula es la siguiente: 


g Ax 
Wiji= Y Y (Xikm=Xik) (Xikm — X jk) 
k=l m=l 


Cuando la matriz W se divide por (1 — g) se tiene la matriz de covarianza 
dentro de grupos, se pueden obtener los coeficientes de correlación dentro de los 
grupos con el mismo procedimiento que para la matriz 7. Cada coeficiente es un 
estimador del grado de relación entre pares de variables dentro de los grupos. 

Cuando no existen diferencias entre las medias de los grupos, todos los ele- 
mentos de la matriz “W”, y de la “T” serán iguales y si las medias son diferentes, 
entonces los elementos de “W” serán más pequeños que los elementos corres- 
pondientes de “TP”, Estas diferencias se pueden medir utilizando la fórmula: 


B=T-W 
(baj == Wij) 


Las matrices “W” y “B”, tienen toda la información acerca de las relaciones 
intergrupo e intragrupos que pueden utilizarse para desarrollar las ecuaciones 
simultáneas y resolviendo éstos se obtienen los valores “E/GEN”. También la 
solución de las ecuaciones proporcionan los valores y o coeficientes v. Los coe- 
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ficientes y sirven para obtener los pesos de cada variable y la puntuación dis- 
criminante, mediante la aplicación de la fórmula: 


» 
ui =Vi VN 8 y Uo= DD miXi. 


Los valores de EIGEN indican la importancia relativa de las variables. La 
función con más alto valor EIGEN es la que tiene un mayor poder discriminante. 
El paquete SPSS proporciona información como la de la tabla 13.4, en donde se 
tiene: valor EIGEN, porcentaje relativo y correlación canónica. 


Tabla 13.4, Medidas de la importancia. 


Función 
discriminante Valor EIGEN Porcentaje Correlación 
canónica relativo canónica 

1 9.66 85,54 952 

2 1,58 13.98 782 

3 54 47 225 


Fuente.- Datos ficticios 


La tabla 13.4 indica que el valor E/GEN de la primera función es seis veces 
mayor que la de la segunda: para entender mejor esto, veáse la columna del por- 
centaje relativo. Dicha columna indica que la primera función tiene el 85.54% 
del valor discriminante 

La tercera función no es importante, ya que tiene el mínimo porcentaje rela- 
tivo del poder discriminante total. No hay normas para decir qué tan grande debe 
ser el porcentaje relativo. Éste depende del caso en estudio y del número de fun- 
ciones que el investigador esté considerando. 

Otra manera de evaluar la importancia de una función discriminante es el 
coeficiente canónico. Esta función mide la asociación de los grupos y la función 
discriminante. El coeficiente canónico tiene un rango de O a 1, en donde el cero 
indica que no hay asociación, y el 1 indica la máxima asociación, En este ejem- 
plo este coeficiente tiene un valor de 0.966, que muestra una fuerte relación 
entre los grupos y la función discriminante. La tercera función contiene un coe- 
ficiente bajo, lo cual indica su poca importancia. Debe mencionarse que en la 
interpretación del coeficiente canónico hay que tener mucho cuidado, ya que 
cuando el número de datos es grande difícilmente se puede obtener un coefi- 
ciente alto. 

El valor lambda de Wilks es otra de las medidas de interpretación de la impor- 
tancia de las funciones discriminantes, y además sirve para demostrar la signifi- 
cación estadística de la función discriminante. Lambda es una medida basada en el 
examen de los errores (residuales), o la habilidad de las variables discriminantes. 
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El valor lambda de Wilks es una medida inversa con un rango de O a 1. Un 
valor lambda cercano a cero muestra una mayor discriminación. Lambda se 
Puede convertir en una prueba de significancia, o sea en una aproximación de 
prueba F o Ji cuadrada. El paquete SPSS efectúa esta conversión mediante la 
siguiente fórmula: 


53] 


Log lambda 


y además proporciona esta información para cada función discriminante, con sus 
grados de libertad y su nivel de significancia. Estos datos sirven para que el 
administrador escoja la función discriminante con un valor de Ji cuadrada alta o 
significativa. Si el lector está interesado en la aplicación e interpretación de este 
análisis discriminante, puede ser su aplicación en Mercadotecnica Social 
(Namakforoosh). 


13.6 ANÁLISIS DE FACTORES 


Es un modelo estadístico multivariado que se utiliza cuando el investigador bus- 
ca las intercorrelaciones dentro de un conjunto de variables. 

En otras palabras, es una manera de explicar la correlación entre un grupo 
de variables, suponiendo la existencia de algunos factores comunes que influyen 
en todas ellas. 

El análisis factorial reduce la multiplicidad de pruebas y medidas hasta 
lograr una sencillez notable. Indica qué pruebas o medidas pertenecen al mismo 
grupo y cuáles miden prácticamente lo mismo. Por lo tanto, reduce el número de 
variables y ayuda a localizar o identificar unidades o propiedades fundamentales 
en que se deben basar las pruebas. 

Un factor es una construcción hipotética, una entidad hipotética, en la que 
supuestamente se basan pruebas, escalas, reactivos y medidas de cualquier tipo. 

Entonces se puede resumir que el análisis de factores tiene dos objetivos 
principales: 


1. Resumir la información contenida en un conjunto de variables en función 
de otro conjunto menor. Las nuevas variables se denominan factores. 

2. Explicar un fenómeno complejo en función de unas cuantas variables o 
factores. 


13.6.1 Representación gráfica de análisis de factores 


Para entender la naturaleza esencial del análisis de factores se explica un análisis 
simple de dos factores en forma gráfica. Supóngase las cifras de los renglones de 
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una matriz factorial como coordenadas, se graficarán en el espacio geométrico 
Como se presenta en la figura 13.2. 

Los dos factores A y B se colocarán en sentido perpendicular para que for- 
men un ángulo recto. También se conoce como eje de referencia donde los dos 
ejes indican los valores de cargos factoriales apropiados, después se trata a cada 
uno de los cargos de la prueba como coordenadas y se expresan gráficamente. 


Factor A. 
PE O O A E 
0.10 030 0.50 070 090 


Figura 13.2. Presentación gráfica de factores. 
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Por ejemplo, los cargos de la prueba R son (.79, . 10). En la abscisa A se indica 
.79 y en la B, 10, esta intersección de puntos se representa en la figura 13.2 con 
la letra para diseño de la prueba. De manera similar se pueden graficar las coor- 
denadas de las otras pruebas. 

Ahora se puede apreciar con claridad la estructura factorial. Cada prueba 
está demasiado cargada en un factor, pero no en el otro. Son medidas relativa- 
mente puras de sus factores respectivos. En la figura 13.1 se presenta un séptimo 
punto, por una cruz dentro de un círculo, para ilustrar así una supuesta prueba 
que mide ambos factores: sus coordenadas son (.60, .50) lo cual significa que la 
prueba está cargada sobre ambos factores: .60 en A y .S0 en B, y por esta razón 
no es “pura”. En los factores ortogonales (los ejes son perpendiculares entre sí), 
las cargas de las pruebas son sustanciales y “puras”. 

El procedimiento de análisis de factores. 

Las principales etapas de un análisis factorial se indican en la figura 13,3. 


A continuación se explica brevemente cada etapa. 


1. Cálculo de la matriz de correlación. La primera etapa de un análisis fac- 
torial es calcular y preparar las medidas de asociación para una serie de 
variables importantes. El investigador debe definir el universo relevante 
del análisis. La naturaleza de las variables incluidas en el análisis tiene 
una implicación crucial en el resultado de análisis factoriales y sus inter- 
pretaciones. Por ejemplo, se tienen datos de 10 individuos en término de 
ocho características sociales (variables); se puede calcular la correlación 
entre cada par de las características sociales (Tipo R) o entre cada par de 
individuo (Tipo Q). Si se aplica el análisis factorial a la matriz de co- 
rrelación de unidades (objetos, individuos, comunidades u otros simi- 
lares) se llaman análisis factoriales Q, si se aplica análisis factorial a la 
matriz de la correlación de variables se llama análisis factorial R, el 
análisis factorial R es el análisis más común.!! 

Existen diversos métodos para el análisis factorial de una matriz de 
correlación: de factores principales, centroides, de diagonales, de posi- 
bilidades máximas, de grupos múltiples, de imagen alfa y otros.!? El 
método que más se usa en la actualidad y que puede encontrarse en 
cualquier centro de computación es el método de factores principales. 

2. Definir factores. El método de los factores principales es relativamente 
el mejor método de transformación de una serie de variables a otra nueva 
serie de variables compuestas o factores principales no correlacionados 
(ortogonales). 


1 Norman, Bali. Senkins, Steinbrenner y Bent Statistical Package for the Social Sciences, Za. edi- 
ción, McGraw-Hill, Co. U.S.A., 1975, p. 470. 


12 Kim Jae y Mueller Charles, Factor Analysis Statistical methods and Practical Issues SAGE 
Publications lnc., BH. California, 1981. 
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Problema de la investigación 
+ Tamaño de muestreo. 
»+ Escala de variables 
+ Cuáles variables incluir 
+ Cuántas variables incluir 


Correlación de variables 
R'Análisis de factores 


Análisis de facto- Análisis compo- 
mentes 


res comunes 


Correlación de los sespon- 


dentes individuales 


“Q” Análisis de factores 


Método de extracción 
ortogonal 


Matriz de factores 
no rotados 
Número de factores 


Puntuación de factores 
para análisis subse- 
cuente 


+ Regresión 
+ Análisis discriminante 
+ Correlación 


Figura 13,4. Diagrama de decisión en análisis de factores. 
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Este método es satisfactorio matemáticamente porque produce una sola 
solución matemática a un problema factorial. Su principal característica es que 
extrae una cantidad máxima de varianza conforme al cálculo de cada factor.!3 El 
primer componente principal o factor principal se puede considerar como la 
mejor relación lineal exhibida en los datos y al segundo coeficiente le conside- 
ran como la segunda mejor relación lineal exhibida en los datos, así sucesiva- 
mente. Es decir, el primer factor extrae la mayor cantidad de varianza, el segun- 
do la mayor cantidad que le sigue y así sucesivamente. 

La fórmula de los principales componentes se puede expresar así. 


2 ¡F, + a2F2 ++ >> + ajmFm + da 
=1,2.2 
donde 
Zi La ¡ variable en forma estándar. 
Fi Factores hipotéticos. 
Uj = Factor único para la variable j. 
aji  = Cargos de factor o coeficiente de regresión múltiple del variable ¿ 
en factor ¿. 
di = Coeficiente de regresión de variable f en factor único. 


13.6.2 Rotación de los factores 


Un aspecto importante en el análisis de factores es la rotación de factores. La 
rotación de factores es necesaria para que los resultados producidos por el análi- 
sis sean interpretables. Dice Thurstone!* que las matrices de factores originales 
son arbitrarias, porque se dispone de un número infinito de marcos de referen- 
cias (ejes) para representar cualquier matriz dada. La matriz de factores princi- 
pales y sus cargos explican la varianza factorial común de las puntuaciones de 
prueba, pero no proporcionan, en forma general, las estructuras significativas 
desde el punto de vista científico. El punto fundamental de interés, lo consti- 
tuyen las configuraciones de las pruebas o variables en el espacio factorial. Para 
describir estas configuraciones adecuadamente hay que girar los ejes arbitrarios 
de referencia. En otras palabras, se supone que existen posiciones únicas e 
idóneas de los ejes, que son las “mejores” formas de enfocar o ver las variables 
en el espacio de » dimensiones, 15 


13 Thom son G. The Factor Analysis of Human Ability, Houghton-Mifttin, Boston, 1971. 

14 Thurstone L. y Thurstone T. Factorial Analysis of Intelligence, Chicago University Press, 
Psychometric Society, 1968, pp. 508-509. 

15 Catell, R. Factor Analisis, Nueva York, Harper and Row, 1952, p. 66. 
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Explicar si la técnica de rotación está fuera de los objetivos de esta obra; a 
quienes les interesa profundizarse en esta parte del análisis de factores se 
recomienda a Onkini y Mueller Donald E. Morrison. !6 17 

Para determinar el tipo de análisis de factores el investigador debe de cono- 
cer el análisis y los tipos de varianza. Hay tres tipos de varianza: 


1. La varianza común, es aquella varianza que es común en todas las varia- 
bles. Es decir, es la varianza de una variable que está compartida con 
otras variables del estudio. 

2. La varianza específica, es la varianza asociada con sólo una variable 

específica. 

3. Varianza de error, puede ocurrir durante el procesamiento de datos, el 

muestreo, en el instrumento de medición o fenómenos aleatorios. La va- 
rianza total es la suma de todas las tres varianzas. 


En el modelo de análisis de componentes se utiliza la varianza total, pero en 
el modelo de análisis de factores comunes se usa la varianza común. Hablando 
matemáticamente: la matriz de correlaciones en el modelo de análisis de compo- 
nentes tiene un valor en su diagonal principal pero en la diagonal de la matriz de 
correlaciones del modelo de análisis de factores comunes hay valores comunes. 


13.6.3 Criterio para seleccionar el número de factores 


Hay varias reglas para decidir cuántos factores extraer y cómo. Por lo general, 
cuando se aplica el análisis de factores a un gran número de variables, el investi- 
gador selecciona como primer factor aquello que tiene la mejor combinación y 
el segundo factor será la mejor combinación, etcétera, pero ¿cuántos factores se 
pueden seleccionar? 


1. La prueba de significancia asociada con la probabilidad máxima y la 
solución de mínima cuadrada, 

2. Variaciones de valor EJGEN. 

3. La importancia substativa. 

4. El grado de interpretación. 


El propósito principal del análisis de factores es encontrar una forma de re- 
sumir el contenido de la información en las variables originales en una serie de 
nuevas dimensiones compuestas (factores). Hablando más específicamente, las 
cuatro siguientes funciones se pueden realizar con análisis de factores: 


16 Onkira-Joe y Muller W. Charles, Factor Análisis, SAGE Publications, Londres 1981, pp. 
30-40. 

Y Morrison, Donald F. Mulrivariate Statistical Methods, MeGraw-Hill Book Co., 1967, pp. 
277-285, 
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1. Identificar una serie de dimensiones no fácilmente observadas en una gran 
serie de variables. También se llaman análisis factoriales de tipo “R ”. 

2. Para proyectar un método para combinar o condensar un gran número de 
gente de una población a grupos diferentes se pueden usar análisis facto- 
riales “Q”. 

3, Dentro de un gran número de variables, identificar aquellas variables que 
sean apropiadas para un análisis de regresión subsecuente, correlación o 
análisis discriminante, 


Es importante notar que no se puede usar análisis de factores cuando el 
tamaño del muestreo es pequeño, es decir, cuando hay menos de 100 observa- 
ciones. Como una norma general, debe haber tantas observaciones que sean 
cinco veces mayores que las variables del estudio. 


13.6.4 Modelos de análisis de factores 


Hay dos modelos básicos de análisis de factores que el investigador puede uti- 
lizar para obtener soluciones factoriales: 


1, Análisis de factores comunes. 
2. Análisis de componentes. 


La prueba más satisfactoria es la prueba de significancia 1? asociada con la 
probabilidad máxima. 

Valor EIGEN es el criterio más común que se aplica para determinar el 
número de factores. 

En el análisis componente se considera significativo a un factor cuando su 
valor E/GEN es mayor de 1. Cuando se aplica el modelo de factores comunes, el 
valor E/GEN dependerá de la estimación de la varianza común, 

Otro criterio puede ser el porcentaje de varianza explicado por cada factor; 
los factores que explican mayor varianza son mejores. 

El peso del factor sería otro criterio, el peso del factor se conoce como la 
correlación entre una variable original y su factor respectivo. 

Por lo general, a los factores con pesos + .30 se les considera significativos. 
Los factores con un peso 1.40 se consideran significativos pero aquellos con un 
peso 1.50 se consideran más significativos. Es importante tomar en cuenta el 
número de variables; cuando hay mayor número de variables en el estudio, dis- 
minuirá el nivel de aceptación de pesos de los factores. 


13.7 ANÁLISIS DE CORRELACIÓN CANÓNICA 


Correlación canónica es un modelo de estadística multivariado que estudia la 
relación entre un grupo de variables dependientes y un grupo de variables inde- 
pendientes. 
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Los objetivos del análisis canónico son: 


+ Determinar si existe una relación entre dos grupos de variables y la mag- 
nitud de esta relación. 

+ Derivar una serie de pesos para cada grupo de variables dependientes e 
independientes, tal que la combinación lineal sea altamente correla- 
cionada. 

+ Derivar funciones lineales adicionales que maximicen la correlación 
restante. 


Se puede decir que la correlación canónica tiene por objetivo encontrar una 
correlación compuesta entre dos series de variables, dependientes e indepen- 
dientes. Entonces la correlación canónica es un análisis de regresión con K va- 
riables independientes y m variables dependientes. La idea básica es que por 
medio del análisis de los cuadrados mínimos se forman dos conjuntos lineales, 
uno para las variables independientes, Xj y otro para las variables dependientes 
yj. La correlación entre estos dos se llama canónica. 


13.7.1 El modelo matemático 


Suponga que se tienen dos grupos de variables X y Y, que pueden recibir nom- 
bres de variables dependientes e independientes o simplemente pueden ser dos 
grupos de variables. Cada grupo está compuesto de varias variables, X, , X2, Xp 
y Y¡, Y: : * yo, entonces hay P variables en el grupo X, yo variables en el Mipo 
Y, 


Se presenta en forma matricial en la figura 13.5. 

Cada (P + 9) variable, se intercorrelacionará con las variables restantes, pro- 
duciendo una (P + 9) por (P + 9) matriz cuadrada y simétrica de coeficientes de 
correlaciones. 


Caso 1 
Caso 2 
Caso 3 


Caso N 


Figura 13.5. 
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Xx Xx e 2 bo" ho 


Figura 13.6. 


La matriz de correlaciones R se puede dividir en cuatro submatrices, Ry, 
que tienen la correlación de los X,, R,,, que tiene la correlación de los Y's y Ry y 
Rx, que tiene la correlación de cada una de las variables de un grupo con cada 
una de las variables de otro grupo. (Ver figura 13.6.) 

Se denota la combinación lineal de las variables originales como una 
suma de peso de las variables, entonces si se tiene un grupo de variables (Z;, 
Za, Za * ** Za) la combinación lineal sería: 


Z= aya + ax + ax *> 0 + Anta 


" 
Z=Y azi 


En el anáfisis de correlación canónica, la combinación lineal de las va- 
riables Xs se forman como una combinación lineal de las variables Ys. Hay 
infinidad de combinaciones lineales para cada grupo, pero se seleccionan los 
coeficientes de tal manera que la combinación lineal de las variables X sea alta- 
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mente correlacionada con las combinaciones lineales de las variables Y. Se va a 
denotar X y Y como combinaciones lineales de X y Y, entonces 


X= 2iX; 
Y = 2oX; 


La correlación canónica selecciona a los valores de as y b¡s tal que 2, sy 
sea un valor máximo posible. 


13.7.2 Interpretación 


En un análisis de correlación canónica, resultan cuatro tipos de informaciones 
importantes: 


1. El coeficiente canónico o variante canónica, Muestra la importancia de la 
variable original para derivar las funciones canónicas. 

En la interpretación de los coeficientes, la magnitud y la dirección 
son importantes, Entre más grande sea el coeficiente, más importante 
será la variable de interés. Las variables con un coeficiente negativo 
indican una relación inversa; sin embargo, la interpretación de la impor- 
tancia relativa o su contribución, tomando en cuenta su coeficiente 
canónico está sujeto a los mismos criterios respecto a la interpretación de 
los Bs (coeficientes de regresión). Por ejemplo, un coeficiente pequeño 
puede significar que la variable correspondiente es irrelevante (tiene 
poca importancia) o puede ser que está compartiendo su importancia con 
otra variable por estar correlacionada con ella.!$ 

Para evitar dichas dificultades de interpretación se puede usar el 
peso. El peso se calcula en cada grupo de variables dependientes e inde- 
pendientes entre cada variable observada original y su función canónica. 
Entonces, el peso refleja la varianza que la variable observada comparte 
en la función canónica y se puede interpretar como el peso en el análisis 
de factores. 

. Correlación canónica. Muestra la relación entre dos variables. El cuadra- 
do de esta correlación muestra la cantidad de varianza compartida entre 
las variables dependientes e independientes. Se conoce también como 
Raíz Canónica. 

3. La prueba de significancia. Se puede usar la prueba de F, pero la prueba 

más comúnmente utilizada es Ji cuadrada con un nivel de significancia de 
056.01. 


p 


18 Cuando dos variables están correlacionadas, una puede. mostrar su importancia, porque cuando 
vna de las dos presenta su contribución la otra no tiene contribución adicional y autónoma a presen- 
tar. El coeficiente de la primera variable será grande y el de la segunda será muy pequeño (casi 
cero). Esto es el problema de la multicolinealidad. 
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4. Medida de redundancia. Es una medida para determinar la cantidad de 
varianza compartida entre dos grupos de variables. Es algo como R? o 
raíz canónica pero con informaciones adicionales que dan una mejor 
interpretación. 


Para determinar el número de funciones canónicas, el procedimiento es si- 
milar al análisis de factores, la primera función será aquella con mayor varianza 
en los grupos de las variables, la segunda será aquella con tanta posible varian- 
za, que no se ha tomado en cuenta en la primera función y así sucesivamente. 


13.8 ANÁLISIS AGRUPADOS (CONGLOMERADOS) Y TÉCNICAS 
DIVERSAS 


El término análisis agrupados abarca un cuerpo estructurado de algoritmos ad 
hoc, que se utilizan en la exploración de datos que surgen de la medición de un 
número de características para cada una de las variadas colecciones de indivi- 
duos u objetos. Con la exploración se pretende ver si lo más reciente se puede 
subdividir en grupos que con base en las medidas puedan mostrar ser relativa- 
mente distintos o corresponder juntos. Lo que se pretende es claramente diferente 
del análisis de la función discriminante, o las técnicas de asignación similares, 
Usadas para la agrupación de personas a grupos conocidos. A diferencia de esto, 
los análisis agrupados están relacionados con la mayor dificultad e intrínseca- 
mente con el interesante problema de descubrir los grupos en primera instancia. 

Los análisis agrupados tienen problemas peculiares. El más serio es la falta 
de una definición satisfactoria de lo que constituye un grupo. Por esto, la ma- 
yoría de las técnicas de agrupación no pueden ser formuladas en términos 
matemáticos precisos como técnicas tales como el análisis del factor. 

Muchos autores han considerado el problema de definición, por ejemplo, 
Ling ( 1972), y es obviamente crucial en muchos aspectos. Sin embargo, puesto 
que la aspiración principal de esta sección es de instruir a los lectores con algunas 
técnicas de agrupación particulares, y sus problemas implícitos, es conveniente 
ignorar que se refiere a la definición y la palabra agrupación o grupo, se usará en 
un sentido inwitivo para una colección de individuos u objetos similares. 


13.8.1 Medidas de similaridad y distancia 


En muchos métodos del análisis de agrupación la primera etapa es la conversión 
de la matriz de datos (1 X p), a una matriz (» X n) de similaridades y no similari- 
dades interindividuales. Este proceso se conoce como las medidas de las rela- 
ciones entre pares de individuos, dados los valores de un conjunto de variaciones 


39 Ling, R. F. On the Theory and construction of K-clusters Computer. Journal No. 15, 1972, pp. 
326-332. 
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Pp para cada uno. Valores de alta similaridad indican que los dos individuos son 
parecidos con respecto al conjunto de variaciones, una alta no similaridad indica 
lo opuesto. Por lo general, las medidas de similaridad toman valores entre cero y 
uno, las medidas de no similaridad pueden tomar cualquier valor positivo. Una 
diferencia más fundamental entre medidas de similaridad y no similaridad, se 
introduce requiriendo lo último para satisfacer la inecuación métrica (ver Everitt, 
1974, p. 563% en cuyo caso en general se les nombra como medidas de distan- 
cia. Las medidas de similaridad comúnmente utilizadas son el coeficiente de 
apareamiento para datos binarios. La medida de distancia mejor conocida es, por 
supuesto, la euclideana. Por ejemplo, en algunas situaciones, en experimentos de 
“preferencia” psicológica, los datos pueden surgir como una matriz de simila- 
ridad o no similaridad, que se puede usar entonces como una entrada directa 
para algunas técnicas de agrupación. Consideraciones de medidas de similaridad 
y no similaridad son dadas en Sneath y Sokal (1973).21 


a) Técnicas jerárquicas aglomerativas 


El procedimiento básico con todos los métodos de este tipo es similar empezan- 
do con una matriz de similaridad o no similaridad interindividual, proceden por 
una serie de funciones sucesivas de los n individuos dentro de grupos que culmi- 
nan en la etapa donde todos los individuos están en un grupo. 

En cualquier etapa particular de este procedimiento, los métodos fusionan 
los individuos a los grupos de individuos que son más similares. 

Diferencias entre métodos surgen por las diversas maueras de definir la si- 
milaridad entre un individuo y un grupo que contiene vazios individuos o entre 
dos grupos. Por ejemplo, un método conocido como agrupación de grupos 
promedios define similaridad entre agrupaciones como la similaridad promedio 
de todos los pares de individuos en las dos agrupaciones. Otro método muy 
conocido de este tipo, llamado agrupación por vínculo único, define similari- 
dades entre las agrupaciones como la'similaridad entre los dos miembros más 
cercanos de cada uno. 

Surgen varias dificultades cuando se utilizan estas técnicas en la práctica. 
En primer lugar, dan una indicación no clara del número correcto de grupos por 
considerar, para un conjunto de datos dados (ver Everitt, op. cit. 1974, p. 59). 
Una segunda dificultad es que la agrupación realizada por una técnica particular 
tiende a reflejar cualquier suposición implícita que contiene acerca del tipo de 
estructura presente en los datos. 

Jardine y Sibson (1968)? tratan otro problema. Ellos señalan que las medi- 
das de similaridad y no similaridad rara vez tienen una significancia numérica 


20 Everitt, B. S. Cluster analysis, Heinemann; Londres-1974. 

21 Sneath y Soka, Principles of numerical taxonomy, Feeman, Londres, 1963. 

22 Jardine, N. y Sibson, R. The Construction of Hierarchic and non Hierarchic clasificarion, 
Computer. Journal No. 2. 


410 ANÁLISIS MULTIVARIADO 


estricta. A causa de las arbitrariedades en las variables y en su fusión rara vez 
hay una justificación anterior para usar valores numéricos particulares en vez de 
valores obtenidos por alguna transformación “monotónica” de ellos, tales como 
sus logaritmos o raíces cuadradas. En la mayoría de los casos, los valores 
deberían ser considerados como teniendo sólo un significado ordinal. Jardine y 
Sibson señalaron que la única técnica jerárquica aglomerativa aplicable en es- 
te caso es la grupación por vínculo único, ya que las soluciones producidas por 
este método no varían bajo transformaciones monotónicas de la medida de simila- 
ridad, Esto los ha llevado a recomendar esta técnica como la única matemática- 
mente aceptable en la clase aglomerativa, una recomendación que ha sido cri- 
ticada por otros autores, por ejemplo, Williams y col. (197 y 


b) Técnicas de optimización 


Otra clase de métodos de agrupación opera formando agrupaciones que optimi- 
cen (minimicen o maximicen) un criterio de agrupación predefinido siendo esto 
alguna medida numérica definida para cada partición de los r-objetos, entre, por 
decir, g-grupos, donde g ha sido fijada por el experimentador. Un ejemplo de un 
criterio comúnmente usado es la minimización de la suma de agrupaciones de 
cuadrados. 

Estas técnicas, como las ya comentadas en a), parece no haber métodos 
aceptables para decidir en un valor particular de g. En la práctica, se utiliza una 
hilera de valores. Un problema ulterior surge en el proceso de optimización 
actual. 

Para cualquier criterio de agrupación, por ejemplo C, la manera obvia de 
optimizar es considerar cualquier posible participación de los n objetos entre 
grupos g, computar C para cada uno, y seleccionar la solución con el valor ópti- 
mo de €. Sin embargo, debido al gran número de posibles particiones, aun con 
una a de tamaño moderado, esto no es practicable y se utilizan varios algoritmos 
en aumento (kil-climbing) o en descenso en el caso de minimización (hill- 
descending), en un intento por alcanzar la partición óptima. Empezando con 
alguna partición inicial de los negocios entre g grupos, cada individuo es consi- 
derado para un posible movimiento desde el grupo en el que está, a uno de otros 
grupos, haciéndose el movimiento sólo si causa un aumento (disminución en el 
caso de minimización) del valor en el criterio de agrupación. Este proceso se 
sigue hasta que ningún movimiento de algún individuo provoque un aumento en 
el valor del criterio. Sin embargo, no hay una garantía de que este método con- 
verja en lo óptimo en lugar de en alguna partición subóptima, En la práctica se 
intenta vencer este problema de soluciones subóptimas, repitiendo el proceso 
con diferentes particiones iniciales, 


22 Williams, W. T. Lance, G. N. Dale. M. B. and Clifford Centro versy concerning the criteria for 
taxonometric strategies, Computer. Journal No. 14, 1971, pp. 162-165. 
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Cc) Agrupaciones 


Consisten en reunir mezclas de distribuciones normales multivariadas. En una 
serie de diarios (1967, 1969, 1970)2* Wolf describe una técnica de agrupación 
basada en reunir mezclas de distribuciones normales multivariadas. 

En síntesis, supone que los datos son una muestra de una población en la 
cual la distribución de las variaciones tiene la forma fx), dada por 


£ 
5%) = Y Aa (Xiu Es) 
E 


En esta expresión x es por un vector de orden p, representando medidas para 
un individuo en p variaciones: As 


donde: 
0=<A,<1y2hb,=1 


es la proporción de individuos en el total de la población sacada desde la sub- 
población s-ava; mientras e, (X| 45, 2, ) es la función normal de densidad multi- 
variada. 


(23092 13,1 “exp AX — uE UA — pa) 


con el vector inferior 1, y la matriz de covarianza Y, en la subpoblación s-ava. 
El problema es identificar y describir las subpoblaciones o agrupaciones dada 
una muestra obtenida desde el total de la población. Se usan técnicas de “posi- 
bilidades máximas” para estimar los parámetros, As, 4; y 2, y cada individuo se 
asocia entonces con una agrupación de acuerdo con su máximo valor P(s/x) 
donde: 


Písix) = P (de un individuo perteneciente a la agrupación s-ava/su vector de 


grados x). 
— AsodX, us 2) 
«) 


Asociada a este método está la prueba de razón de posibilidades g, el número 
de agrupaciones. El principal problema con esta técnica es que requiere de ma- 


2 Wolfe, J. H. Pattern clustering by multivariate mixture analysis multivariate, Behavior Research. 
No. 5-1970, pp. 329-350. 
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yores muestras para obtener estimaciones paramétricas acertadas. Se sabe poco 
también acerca de su robustez, cuando la suposición de normalidad multivariada 
de las variantes está en duda. 


13.8,2 Soluciones de evaluación 


Aunque es natural para un investigador tratar de nombrar e interpretar cualquier 
agrupación que encuentre en un análisis particular, “nombrarlo” por su cuenta, es 
considerado gratuito, a menos que se muestre que las agrupaciones son estables y 
que tienen algún propósito útil fuera de ellas mismas. Una manera de demostrar 
tales propiedades sería mostrar que las agrupaciones tienen valores de predicción 
con respecto a las variables diferentes, a las usadas para definirlas. Por ejemplo, 
Entwiste y Bennet (1974)? usaron el análisis de agrupación en datos, descri- 
biendo características psicológicas y educacionales de estudiantes. 

En los tipos de estudiantes encontrados, se mostró que estaban asociados a 
diferentes niveles de funcionamiento académico, lo que quiere decir que los 
tipos tenfan alguna propiedad de predicción útil. En el mismo estudio, se obtuvo 
una medida de réplica, dividiendo al azar la muestra entre dos y ejecutando 
análisis separados en cada uno. Las agrupaciones obtenidas de cada análisis, 
fueron muy similares, dieron alguna indicación de su estabilidad. 

También hay otros métodos para evaluar la habilidad de predicción de las 
agrupaciones. 

Estas técnicas producen resultados extremadamente diferentes, por tanto, la 
existencia de agrupaciones bien definidas en los datos, será dudosa. De nuevo, 
técnicas gráficas, tales como las que se describen en este capítulo, se pueden 
usar en las técnicas de agrupación, como una ayuda para la evaluación e inter- 
pretación de lo último. 

En realidad, la experiencia es testigo del peligro de reportar una solución par- 
ticular, obtenida por una técnica de agrupación particular, como la solución “co- 
rrecta”, sin hacer ningún intento de valorar su estabilidad y utilidad. 


13.9 GRAFICACIÓN DE DATOS MULTIVARIADOS 


En la descripción y análisis estadísticos de conjuntos de datos, exhibiciones 
visuales y presentaciones gráficas son invaluables y, como el volumen medio se 
conoce, es en general de más ayuda en la comunicación de información que las 
tablas de números, ya que usualmente la gente asimila la información más rápi- 
damente cuando ésta se presenta en forma pictórica. 

Para histogramas de datos univariados se usan más comúnmente diagramas 
de puntos, e ideogramas y para diagramas de dispersión de datos bivariados y 


25 Entwisthe y Bennet, Cluster Anatysís y Educational Research. abstrast in multivariate behavior 
rescarch No. 9, 1974, p. 498. 
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líneas de dirección, son de mucha ayuda. Pero métodos para la representación 
visual de datos multivariados son menos comunes y menos conocidos. Tales 
datos, consistentes de un conjunto de p medidas o punteos para cada » indivi- 
duos u objetos, se pueden conceptualizar en términos geométricos, definiendo p 
puntos en espacios »-dimensionales, o n puntos en espacios p-dimensionales. 

Desde el punto de vista matemático, es más preciso ya que el método visual 
impide ver las cosas en un espacio tridimensional. Una práctica común es visuali- 
zar los variantes en subgrupos de dos o tres, pero esto puede conducir a conclu- 
siones erróneas, como Catell y Coulter (1966) han demostrado. 

En esta sección se describirán varios métodos para obtener una repre- 
sentación visual de datos multivariados. Algunos de éstos operan directamente 
en la matriz n X p de datos nuevós; otros requieren la matriz n X n de similari- 
dades interindividuales, no similaridades o distancias y son particularmente re- 
levantes cuando los datos surgen en forma de una matriz de “preferencia”, En 
general, todas son mejor consideradas como elementos para una examen preli- 
minar de datos multivariados, los cuales pueden dar una visión interna cualitati- 
va dentro de su “estructura” e indican los modelos más apropiados por usar, para 
un análisis más detallado. 


13.9.1 Técnicas de ordenación 


Las técnicas de ordenación permiten graficar los vectores n, p-dimensionales, 
desde un espacio p a uno de dimensiones menores digamos p*, Si p* 26 3, 
esto permite a los datos, el ser inspeccionados visualmente y que sea identifica- 
do cualquier patrón. Una técnica de ordenación comúnmente usada es la del 
análisis componente inicial. Graficando los datos en el espacio de los primeros 
dos o tres componentes, se puede obtener una indicación de cualquier estructura 
presente. Una técnica más compleja es la desarrollada por Sammon (1969)??, 
llamada Graficación no lineal (Non-linear mapping) o NLM. Estos intentos de 
obtener una representación dimensional menor de los datos, minimizando una 
función de las diferencias en las distancias, d;j, entre puntos en el espacio p ori- 
ginal y aquellos en el espacio reducido p*, señalados por d*;j. La función es sim- 
plemente una suma considerada de cuadrados de estas diferencias y es: 


26 Catell, R. B. y Couther, M. A. Principles of behavioral taxonomy and the matematica! basical the 
taxonome computer program, British Journal of mathematics and statistical, No. 19-1966, pp. 237- 
269. 


7 Sammon, A non-linear mapping for data structure analysis IEE, Trans computers, 1969, pp. 401 
409. 
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Esta consideración particular tiende a preservar una estructura “local”, en el 
sentido de que cada punto en el espacio p*, sostiene aproximadamente la misma 
relación con sus vecinos más cercanos, como lo hizo en el espacio p, sus rela- 
ciones con puntos relativamente distantes en el espacio p pueden ser un poco 
diferentes en el espacio p*. Empezando con una configuración arbitraria de dos 
dimensiones (suponiendo que se está interesado en la solución donde p* = 2), 
los puntos son ajustados, usando el procedimiento descendiente con más pen- 
diente, para que E sea minimizado. Esto da una configuración final de 2 di- 
mensiones, que conserva mucho de la estructura presente en el original de p 
dimensiones. 

Como ya se indicó, algunas técnicas de ordenación operan directamente en 
la matriz de similaridades, no similaridades o distancias interindividuales. Quizá 
el más simple de éstos es el método descrito por Gower (1966)25, conocido 
como el análisis principal de coordenadas. Esto es un método de “raíz latente” y 
de vectores, que recupera coordenadas para puntos de una matriz, dando distan- 
cias entre ellos. En muchos casos, las primeras dos o tres de estas coordenadas, 
pueden dar una representación razonable de las distancias, consecuentemente se 
puede elaborar una gráfica y realizar una investigación visual para la estructura 
que se ha tomado. 


13.92 Usando caras para representar datos multivariados 


Chernoff (1973)? “describe una técnica que representa cada observación p 
dimensional por la caricatura de una cara, cuyos rasgos, tales como curvatura de 
la barba, forma de la nariz, etcétera, se determinan por los valores tomados por 
variables particulares. Una muestra de puntos en un espacio p-dimensional, se 
representa por un conjunto de caras y “agrupaciones”. 

Otra técnica similar la sugiere Frith (1974)%, quien representa una obser- 
vación por una cara que varía entre dos extremos, dependiendo de los valores de 
la variable. En este método los rasgos que se usan para representar variables, se 
muestran en la figura 13.11 y las dos caras de los extremos se muestran en las 
figuras 13.9 y 13.10. Hasta nueve variables pueden ser representadas, pero el 
número se puede incrementar sumando otros rasgos. 

Desde luego las observaciones pueden ser fácilmente representadas por ras- 
gos de otros objetos familiares, pero la representación en términos de caras, 
puede ser más útil, ya que es usual estudiar y analizar caras y clasificarlas dentro 
de tipos étnicos. En consecuencia, pueden ser capaces de clasificar rápidamente 


23 Gower, J. C. Some distance properties of latent root and vector methods used in multivariate. 
Analysis Biometrika No. 53. 1966, pp. 325-334. 


2% Chernoff H. Using faces to represent in K. dimensional spaces graphically, Journal of 
Administration Statistic Association, No. 68-1973, pp. 361-368. 


2 Frith, C. Mudltivariate Analysis Chapman y Hall Ltd. Londres, 1977, p. 149. 
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de una manera útil un conjunto de cosas cuyas características se expresan en tér- 
minos de apariencia facial (ver Everitt y Nicholls, 1975).31 


Ejemplo 13.1 


Se elaboró un conjunto de datos muestreando diez observaciones, de cada una de 
tres distribuciones normales de 5 dimensiones, bien separadas teniendo la misma 
matriz de varianza-covarianza, pero teniendo diferentes vectores. Tres de las téc- 
nicas descritas, especialmente gráficas no lincales, el método Andrews y el 
método de caras se aplicaron entonces a las 35 observaciones dimensionales, en 
un intento de ver qué tan bien estaba indicada la estructura de los datos por cada 
uno. 


a) Graficación no lineal. Las representaciones de dos dimensiones dadas 
por este método se muestra en la figura 13.7, donde la estructura de la 
agrupación, en los datos, es claramente evidente. 


b) El Método de Andrews. En la figura 13.8 se muestran las gráficas de las 
funciones, de puntos 35 dimensionales. Muestran tres distintas franjas de 
puntos en (: = 0,5, que indican con claridad que los datos contienen agru- 


paciones separadas. 


Cc) La técnica de “caras”. Las caricaturas de 30 caras, representando los 
datos, se muestran en la figura 13.11. La mayoría de las personas, al 
pedirles que las clasificaran dentro de tres grupos de caras similares, 
recuperan los grupos de puntos como fueron producidos, pero una solu- 
ción menos clara se podría producir si a los sujetos no se les dijera el 
número de grupos. 


13.10 RESUMEN 


Los métodos de análisis de datos descritos en este capítulo deberían considerarse 
como ayudas para obtener un resumen de valiosa información de los datos origi- 
nales y para construir hipótesis dentro del sujeto involucrado (citas de Sibson, 
1972). Como otros métodos de análisis multivariados, no son una panacea para 
datos pobres, y el usuario debe mantener en su mente cualquier suposición 
implícita. Sin embargo, usados en asociación con otras técnicas multivariadas, 
tal como componente principal y análisis “canónico” variado, en general llevan 
a una comprensión mayor dentro de los complejos patrones que pueden existir 
en datos multivariados. 


3! Everist B. S. y Nicholls P. G., Visual technique for representing multivariate data, The Statistician 
No. 1-24, 1975, pp. 32-45. 
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CAPÍTULO 


14 


Preparación del reporte 


14.1 INTRODUCCIÓN 


La última etapa de una investigación consiste en la interpretación de los resulta- 
dos de los análisis estadísticos y la redacción del reporte final. No importa cuán 
satisfactorios sean los datos; si no están interpretados y redactados adecuada- 
mente en un reporte final, poco aportarán al resultado de la investigación. Inde- 
pendientemente de cuán sofisticado haya sido todo el proceso, la investigación 
puede fallar si el reporte no transmite los resultados adecuadamente. 

El reporte final debe dar una indicación al lector acerca de qué es lo que se 
necesita hacer, y cuáles deben ser los pasos a seguir. Por lo general, a los ejecu- 
tivos que les interesan los resultados del estudio, deberán estar convencidos de 
que los resultados son útiles, y de que pueden diseñar sus estrategias de acción 
basándose en el reporte del investigador. 

Este capítulo, si bien no tan extenso como los anteriores, trata de un tema de 
gran importancia para el éxito del investigador y de su trabajo, como lo es la 
interpretación de los datos y el reporte de la investigación. 


14.2 INTERPRETACIÓN 


El resultado de un conjunto de datos estadísticos, rara vez proporciona directa- 
mente información entendible y útil. Corresponde al investigador a partir de ese 
momento dedicar sus conocimientos, esfuerzo y tiempo a interpretar esta data y 
a indicar a los responsables de toma de decisiones en la organización el signifi- 
cado de los resultados. Es en esta etapa en que el investigador deberá dedicar 
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horas al estudio de tablas y gráficas estadísticas, al cálculo de ciertos aspectos y 
a llevar todo a un lenguaje entendible. 

La interpretación de datos consiste de dos etapas: revisión del proceso de 
investigación e interpretación de los resultados. 


14.3 REVISIÓN DEL PROCESO DE INVESTIGACIÓN 


La primera etapa de la investigación de datos es aquella en la que el investigador 
revisa todo el proceso de la investigación, basándose en su conocimiento del di- 
seño de la investigación. El investigador deberá: 


* Conocer perfectamente el problema del estudio. 

+ Conocer la razón de ser de cualquier hipótesis del estudio, 

+ Saber de dónde provienen los datos. 

+» Conocer las técnicas y métodos de recopilación de datos 

+ Conocer el procedimiento de muestreo a emplear. 

+ Estar familiarizado con las técnicas estadísticas aplicadas en el estudio. 


Revisar el proceso es importante para los estudios grandes y complejos, así 
como para aquellos basados en varios tipos de datos secundarios. La revisión 
deberá convencer al investigador de que el diseño de la investigación generó 
data válida, y que por lo tanto puede garantizarse la validez de la interpretación, 
ya que si los datos están falseados, o no son confiables, ni siquiera una excelente 
interpretación producirá recomendaciones que puedan significar algo para el 
responsable de la toma de decisiones 

El investigador deberá revisar los antecedentes de los datos y los parámetros 
importantes involucrados en la toma de decisión. Los parámetros decisionales 
son aquellos en los que el responsable de tomar decisiones puede evaluar el 
resultado de ellas, y entonces, con base en los parámetros decisionales, interpre- 
tar los resultados. 

El investigador también revisa el proceso de recopilación de datos a fin de 
evaluar su significancia estadística. El nivel de significancia estadística es el 
nivel de confianza que se tiene en la data recopilada, esto es, la factibilidad de 
que los datos de la muestra estudiada sean representativos de la población objeto 
de escrutinio. Esto normalmente es función de la validez de los datos y del 
tamaño de la muestra. 

Las interpretaciones superficiales o las casuales, así como los errores de 
interpretación pueden disminuir el valor del estudio Hay que basar toda, o la 
mayor parte de la interpretación en los parámetros decisionales, y actuar con 
creatividad al traducir el análisis de datos a lenguaje entendible para el no-espe- 
cialista. Es necesario incluir las variables no significativas, relacionándolas con 
la empresa, y si son importantes, sugerir otros estudios. 
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14,4 EL INFORME 


Todo trabajo de investigación debe culminar con un reporte escrito para uso de 
la organización, y/o para su posterior publicación. El criterio fundamental para la 
valoración de un reporte es lo que éste le comunique al lector. El reporte debe evi- 
tar excesivas terminologías técnicas, debe ser entendible. Como dice el profesor 
W. Wents: "la gente prefiere vivir con problemas que no saben resolver, que con 
soluciones que no entienden.”! El reporte se debe preparar considerando el nivel 
técnico del lector, así como el tiempo de que disponga y el uso que del reporte 
se vaya a hacer. Hay que preparar algunos resultados preliminares (orales o 
escritos), a varios departamentos de la empresa, y con las preguntas e inquietu- 
des que surjan, evaluar los resultados para poder elaborar un reporte final que sea 
realmente útil a la dirección de la empresa. Algunos directores se interesan so- 
lamente por reportes breves, en los que sólo los resultados son importantes, y 
no la metodología para alcanzarlos. Otros quieren alguna información respecto de 
las técnicas aplicadas al recopilar y analizar los datos; otros requieren de un re- 
porte completo. 

En algunos casos, se interesan por los resultados estadísticos, mientras que 
en otros desean reportes amplios, incluyendo detalles, conclusiones derivadas de 
ellos y recomendaciones. El investigador debe considerar la preferencia de los 
usuarios del reporte para la toma de decisiones. A continuación se describen dos 
tipos de reportes: 


1. Reporte técnico. Este tipo de reporte es un vehículo básico para la inves- 
tigación, debe incluir información completa y detallada. Por una parte, es 
asunto de profesionalismo informar acerca de la investigación; por otra 
parte es necesario fundamentar el estudio, especialmente cuando se trata 
de algún tópico que pueda ser objeto de controversia. 

2. Reporte informal. Son reportes diseñados para informar al lector sin enfa- 
tizar el aspecto técnico del estudio. Representan un reto comunicacional 
para el investigador. Deben estar redactados para ser fluidos, de rápida 
comprensión de los hallazgos principales y de inmediato entendimiento 
de las implicaciones y conclusiones. Normalmente este reporte es más 
corto que el reporte técnico. 


14.5 CARACTERÍSTICAS SUSTANTIVAS 


Para que el reporte sea útil deberá reunir las siguientes características:? 


Y Wents, Walter B. Marketing Research Management Methods and Cases. 2a. Ed. New York, 
Harper £ Row Publishing, 1979. p. 61. 
2 Peterson, Roben. Marketing Research, Business Publications, EUA:1982. p. 64. 
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14.5.1 Precisión 


Se refiere al grado en que la información refleja la realidad; es decir, no sólo la 
investigación debe ser precisa, sino también su reporte. El reporte debe indicar 
con precisión tanto la metodología como los resultados de la investigación. 


14.5.2 Relevancia 


El reporte debe ser relevante. Debe tener información relacionada con los 
parámetros de la investigación y con los objetivos de la organización, Es crucial 
evitar que el informe refleje los intereses particulares del investigador. 


14.5,3 Suficiencia 


Por lo general, se obtiene una enorme cantidad de data como resultado de una 
investigación. Si bien este caudal de información debe condensarse y reducirse a 
volúmenes manejables, es importante que en esta reducción no se pierda la esen- 
cia del trabajo. El informe del investigador deberá fundamentarse en suficiente 
información detallada a fin de no arriesgar la validez de las decisiones que se 
tomen. 


14.5.4 Actualidad y disponibilidad 


Actualidad se refiere a la vigencia de los resultados en el tiempo. El interesado 
en el estudio deberá recibir la información mientras ésta se mantenga vigente. 

Frecuentemente puede ocurrir que, debido a cambios en el entorno, esto es, 
medio ambiente, políticos, organizacionales, del mercado, etcétera, los resultados 
arrojados por un proyecto de investigación hayan perdido parcial o totalmente su 
valor para el responsable de tomar decisiones. Es importante, por lo tanto, que 
los resultados de la investigación estén disponibles al solicitante lo más pronto 
posible, a fin de que se pueda tomar una decisión vigente. 


14.5,5 Cuantificabilidad 


La información presentada por el reporte final deberá ser ante todo cuantificable. 
Cuando nos referimos a ciertos parámetros que son aparentemente cualitativos, 
como por ejemplo lo favorable o desfavorable de la actitud de algunos trabaja- 
dores, consumidores, o la reputación de alguna organización, se pueden utilizar 
escalas ordinales a fin de cuantificar esta información; esto permite conocer la es- 
cala relativa numérica en que estas respuestas afectan el estudio. 
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14.5.6 Factibilidad 


En vista de que parte de la responsabilidad del reporte final es elaborar recomenda- 
ciones y sugerencias, debe tenerse en cuenta la factibilidad de la realización de 
éstas; por ejemplo, si se estudian las razones por la que existe un alto nivel de ausen- 
tismo de los trabajadores en una planta, se encuentra que es por falta de transporte, 
Podría no ser factible sugerir, por ejemplo, que se construyan edificios para los tra- 
bajadores cerca de la planta. Hay que estudiar cuántos trabajadores faltan por tal 
razón, cuál es la rotación de trabajadores, problemas sociales, situación financiera 
de la empresa, etcétera. 


14.6 CRITERIOS AL REDACTAR EL REPORTE 


Hay ciertas consideraciones que se deben tener cuando se escribe un informe, 
para aumentar las posibilidades de una comunicación exitosa entre el investi- 
gador y el lector. Las principales son: 


14.6.1 El reporte debe ser completo 


Un reporte puede considerarse completo cuando proporciona al encargado de 
tomar decisiones toda la información requerida en un lenguaje entendible. 

El investigador debe preguntar continuamente si están obteniendo toda la 
información necesaria para resolver el problema del estudio. Un informe puede 
ser incompleto por ser demasiado breve. Posiblemente el investigador eliminó 
definiciones y explicaciones necesarias. También se puede hacer un informe 
incompleto aunque sea bastante largo; en estos casos suele ocurrir que el trabajo 
en cuestión es superficial y, aunque extenso, posee información extra que guarda 
poca relación con el problema original. 


14.6.2 El reporte debe ser sincero 


El investigador debe ser sincero al exponer los resuitados de la investigación en 
el reporte final. El investigador debe ser honesto en sus hallazgos, procurando 
evitar “rellenos” o explicaciones largas e innecesarias. La sinceridad requerida 
por el informe incluye informar sólo la verdad de lo encontrado, y toda la ver- 
dad. Existe la tendencia de tratar de utilizar los estudios de investigación para 
confirmar lo que el que ordenó el estudio pensaba desde un principio. A veces, 
los hallazgos del estudio no avalan, e incluso contradicen lo que se supuso ini- 
cialmente; el investigador deberá presentar estas conclusiones de una forma 
objetiva y sería, independientemente de la actitud con que sean recibidas, 
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14.6.3 El reporte debe ser claro 


La claridad del informe es muy importante, y está relacionada con el proceso 
lógico de la investigación y con el pensamiento lógico del investigador. No es 
tan fácil elaborar un informe claro; para lograrlo, debe ser gramaticalmente 
correcto, y sin errores de impresión. Su estilo y composición deberán estar 
corregidos y revisados por una persona capaz y deberá estar redactado en un 
lenguaje claro pero completo. La terminología técnica deberá definirse al ser uti- 
lizada por primera vez. Se deberá cuidar el estilo, la redacción y la ortografía. 

Si en las conclusiones se expresan opiniones personales, éstas deberán 
designarse claramente como tales. 


14.7 SECUENCIA LÓGICA DEL REPORTE 
El reporte se compone de las partes siguientes: 
1. Material preliminar 


+ Título del trabajo 

+ Cartas de autorización 
+ Índice de contenido. 

+ Resumen 


2. Cuerpo del reporte 


+ Introducción 

+ Hallazgos 

+ Limitaciones 

» Resumen y conclusiones 
+ Recomendaciones 


3. Apéndices 


+ Apéndice 
+ Bibliografía y referencias 


14,7.1 Material preliminar 


+ Página de título. En general, incluye cuatro puntos: título del reporte, 
fecha, quién lo preparó y quien lo realizó. 

+ Cartas. Por lo general incluye copia de la carta-compromiso original, o 
autorización para llevar a cabo el estudio y los proyectos con sus obje- 
tivos específicos; asimismo define los alcances y limitaciones. 
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147.2 


Contenido, Como recomendación general, un reporte de más de diez 
páginas o de varias secciones deberá tener un índice de contenido que 
especifique también los medios e ilustraciones del estudio. 

Sinopsis. Puede servir de dos maneras: puede ser un pequeño resumen del 
reporte, con una versión breve del contenido del reporte principal, o una 
tabla de contenido explicada a través de los principales puntos de la inves- 
tigación. Esta presentación generalmente llamada “abstract” se utiliza 
mucho en reportes de ingeniería y no suele pasar de unas 150 palabras. 


Cuerpo del reporte 
Introducción. En general la introducción consiste de dos partes: 


a) Exposición del problema. Esta parte incluye la revisión de los trabajos 
publicados al respecto, o resumen de las entrevistas informales para 
explotar y conocer el problema. También hay que presentar los obje- 
tivos del estudio y las hipótesis. 

b) Metodología del estudio. En esta parte se deben especificar las carac- 
terísticas de la población, es decir, diseño de la investigación, técnicas 
de recopilación y análisis de datos. 


Hallazgos. Es el cuerpo principal del informe. El objetivo aquí es expo- 
ner los datos, más que su interpretación o las conclusiones a que se 
llegó. Si es necesario presentar datos cuantitativos, éstos deben expre- 
sarse en forma simple, con gráficas y tablas fáciles de entender. 


Si se desean presentar estadísticas en el cuerpo principal del informe, se 
Pueden presentar en tres formas: 


. Forma textual. Esta forma de presentación estadística es poco común. Es 


útil y aplicable cuando hay pocos datos, se puede explicar textualmente. 
El investigador puede llamar la atención del lector con ciertos números, 
porcentajes, así como enfatizar y subrayar las partes más importantes. 


. Forma tabulada. Cuando los datos son numerosos, esta presentación 


tiene muchas ventajas ya que el ordenamiento de numerosos datos en 
forma de tablas, facilita su entendimiento. La tabulación puede ser desde 
muy breve, describiendo algunos datos, hasta tablas generales, comple- 
jas y detalladas. 


. Forma gráfica. La presentación gráfica tiene la ventaja de ser la que 


aporta mayor información visual, de una forma clara y amena al lector 
del reporte. 
Existen varios tipos de gráficos: 
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Proyección — ventas empresa XYZ, S.A. 


mx 1000 


Figura 14.1 Ejemplo de un gráfico de barras para las ventas de la empresa XYZ, C.A. 


[Modelo Unidades X 1000 
[Modelo MT 

[Modelo M2 230 

Modelo M3 455 

[Modelo M4 3H 

[Modelo M5 Í 


Tabla 14.1 Tabulación de datos según unidades fabricadas. Ver próximo gráfico. 


Distribución de ventas en XYZ 


Modelo M5 Modelo MI 


Modelo M4 


Modelo M2 


Modelo M3 


Figura 14.2 Modelo de un gráfico tipo pastel, en donde se establece un sentido de pro- 
porción visual entre los diferentes modelos que la empresa produce. 
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XYZ vs. Competencia A y B 
250: 


100! 


32 93 94 ES s6 97 e8 99 o 


2 XYZ 2- Compet. A > Compet. B. 


Figura 14.3 Ejemplo de un gráfico lineal para las ventas de la empresa XYZ, C.A com- 
parado con las de dos competidores, A y B. 


XYZ vs. Competencia A y B 


Figura 14.4 Modelo de un gráfico de áreas acumulativo: los componentes de cada serie 
se colocan sobre los anteriores, para dar una idea no sólo de su proporción individual, 
sino del grado en el que todos juntos influyen en la suma total. 
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14.8 LIMITACIONES 


Se deben comentar en el reporte las posibles limitaciones metodológicas que 
pudiesen afectar la validez, la confiabilidad o la generalización de los resultados, 
respecto a: 


a) Procedimientos de muestreo. 

b) Instrumentos. 

£) Recopilación de datos. 

d) Análisis de datos. 

e) Diseño del estudio. 

/) Problemas durante el estudio. 

£) Otras posibles interpretaciones de los resultados. 


14.8,1 Resumen y conclusiones 

El resumen es una breve declaración de los hallazgos. En una investigación 
descriptiva, el reporte puede completarse con un resumen de lo hallado, acom- 
pañado de sus conclusiones y recomendaciones. Las conclusiones pueden tam- 
bién presentarse en forma de tabla para su fácil lectura y referencia 

14.8.2 Recomendaciones 

Usualmente consisten en un número limitado de opiniones y sugerencias del 
investigador. Su naturaleza depende del estudio. En investigaciones académicas, 
se refiere a estudios adicionales y ampliaciones del tema. En investigaciones, 
deben sugerir acciones inmediatas. 


14.8.3 Apéndice 


Se pueden incluir cuadros, estadísticas, copias de documentos, descripciones de 
metodología y otros apoyos a la investigación. 


14.8.4 Bibliografía 

Este punto es indispensable a la investigación, y es posible incluirlo de diversas 
formas en el reporte; desde la detallada, hasta la abreviada a pie de página. 

14.9 PRESENTACIÓN 

La presentación de un reporte puede implicar en un momento determinado, la 


aceptación de un buen estudio, Por ello, en este aspecto se debe tener cuidado 
con lo siguiente: 
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a) Presentación física: Incluye formatos, papel empleado, tipo de impre- 
sión, encuadernado, títulos, etcétera. 

b) Que pueda leerse fácilmente: El reporte debe estar diseñado para el audi- 
torio promedio a quienes está dirigido. Es importante recordar que las 
personas a quienes está dirigido el reporte, si bien pudieran tener am- 
plios conocimientos acerca del mercado y del producto en cuestión, no 
necesariamente son conocedoras de la terminología o de 1a metodología 
estadística utilizada por la empresa que realiza la investigación. 

€) Índice: Debe ser claro e incluir los temas. 

d) Presentación de estadísticas: Las estadísticas pueden incluirse en los 
párrafos de una forma continua y fluida, al final de éstos, o pueden tabu- 
larse o graficarse al final del reporte. 


A menudo los investigadores realizan una presentación oral ante un grupo 
reducido de personas. En estos casos, la presentación deberá incluir el uso de 
tablas y de estadísticas. El tiempo para realizar esta presentación es variable, y 
deberá ser cuidadosamente preparada a fin de cumplir con el tiempo estipulado, 
que puede oscilar desde 30 minutos a varias horas, seguida casi siempre de una 
sesión de preguntas. 

Un índice para el resumen puede ser el siguiente: 


1. Apertura o introducción directa al tema (aproximadamente un 10% del 
tiempo dispuesto). 

2. Hallazgos y conclusiones, presentados en orden de importancia. 

3. Recomendaciones, Representa el foco principal de la discusión; es a esta 
parte a la que, por lo general, están dirigidas las interrogantes. 


La exposición puede utilizar una amplia gama de material de apoyo para hacerla 
más eficaz, mas convincente, así como más amena. Se pueden emplear, por 
ejemplo: 


+ Pizarrones, preferiblemente con marcadores de varios colores 

+ Cartelones de diversos tamaños y colores, preparados previamente. 

+ Audiovisuales, tales como videotapes. 

+ Transparencias. 

+ Presentaciones desde un computador, proyectadas a formato grande por 
medio de equipo auxiliar existente en el mercado. 


Todos estos materiales deben coordinarse entre ambas partes a fin de asegu- 
rarse de que se cuenta con el hardware requerido, y de que hay perfecta compa- 
tibilidad entre medios y equipos. 


CAPÍTULO 


15 


Ética profesional 


15.1 INTRODUCCIÓN 


El investigador en el área de Contaduría y Administración es alguien que tiene 
constante relación con los seres humanos, como observador y participante en los 
sujetos de estudio. Además, con los datos o informaciones que se utilizaron para 
elaborar el estudio, son tales que se relacionan con el bienestar económico y 
social tanto del individuo como la nación. 

Los investigadores interactúan constantemente en un medio sociopolítico y 
socioeconómico complejo que influye en varias formas en sus decisiones. El 
componente principal de este medio es la consideración ética del investigador. 

En este capítulo se explica la ética en la investigación de Contaduría y 
Administración, la definición de ética, la ética en la ciencia social, algunos casos 
y aspectos del código de ética de Contaduría y Administración. 


15.2 ÉTICA E INVESTIGACIÓN 


A la ética profesional se le debe de dar una gran importancia en cualquier profe- 
sión. El investigador en el área de Administración y Contaduría debe tener una 
conciencia clara respecto a la ética profesional. El tipo de investigación que rea- 
liza el investigador (o administrador) influye a veces directa e indirectamente 
con el derecho de los seres humanos, su bienestar económico o social, y hasta a 
veces con la vida personal. 

La honestidad y la honradez son vitales en el campo de la investigación. El 
investigador tiene un papel muy importante en el desarrollo del bienestar social. 
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Un investigador que estudie las causas de accidentes en una fábrica y que 
encuentre fallas que no reporta con el fin de obtener cierta autoridad con el 
dueño o el gerente de la planta, puede causar el fallecimiento de algunos traba- 
jadores e incluso destruir familias. Si ocurren accidentes que él pudo haber evi- 
tado o al menos reportado para que se corrigieran las condiciones inseguras, él 
será directamente responsable de que una familia se quede en el desamparo, o de 
que un hombre quede minusválido. 

En un estudio para introducir al mercado un nuevo producto innecesario 
pero que el investigador recomienda con ciertas recetas a fin de que la gente lo 
compre, puede perjudicar a la economía familiar ya que crea consumismo y 
puede dañar a la economía del país al utilizar recursos materiales de manera que 
no beneficie al sistema económico familiar. 

El administrador que realice un estudio para elaborar cambios profundos en 
una empresa o en una entidad gubernamental, primero debe realizar un estudio 
de costos y beneficios y la factibilidad de los cambios, ya que la realización de la 
investigación debe ser para captar conocimientos necesarios para la toma de 
decisiones en beneficio de la empresa pública y de la nación. 

En el plan de investigación (diseño de investigación) de que se trató en el 
capítulo tres, se insiste en la definición correcta del problema de la investi- 
gación. Si el investigador sigue las etapas de la definición del problema (análisis 
de antecedente, entrevistas informales, revisión de literatura y consultas con los 
expertos) puede resolver el problema de la empresa, a bajos costos y sin tener 
que esperar meses para obtener el resultado de la investigación. 

Suponga que el director de una empresa ayuda a realizar un estudio para 
encontrar por qué sus ventas bajaron drásticamente y si en la etapa de la defini- 
ción del problema se descubre que la calidad de su producto, el precio, su trato 
con los clientes, sus finanzas, etcétera, son favorables y que sólo algunos de sus 
principales clientes, por ciertas anomalías internas propias, disminuyeron el con- 
sumo del producto en estudio, el investigador o consultor tiene que informar al 
director lo que encontró en esta fase y presentar la solución de este problema. 

La ética profesional no permite desarrollar un proyecto de estudio y cobrar 
miles de pesos por realizar una investigación en que la incógnita de dicha inves- 
tigación ya se conoce. 

En una investigación contable (auditoría, es decir, un estudio en que la 
recopilación de datos está basada principalmente en los fibros contables, 
revisión de facturas, examen de los factores con el proveedor, comprobar la caja 
y las cuentas de la empresa), el investigador debe elaborar su trabajo con amplio 
conocimiento y basado en su ética profesional. 

Si se Je obstaculizan algunas etapas de ninguna manera debe de evitar dicha 
etapa, sino al contrario, insistir y pedir la colaboración del Director General y 
actuar en forma muy prudente sin acusar a nadie y sin informar a los empleados 
de las anomalías que ha encontrado y evitar así posibles problemas internos. 

Debe de ser totalmente neutral y no alterarse por lo que encontró; su papel 
es contestar las incógnitas e informar a las autoridades de la empresa mediante 
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un informe escrito. El investigador debe evitar la amistad de cualquier empleado 
durante su investigación. 

A pesar de cierta falta de moralidad, que se observa en el ambiente en que 
se vive, nadie puede evitar enfrentarse a problemas de índole ética en la vida 
cotidiana. Tales problemas afectan directamente al que se los plantea porque se 
refieren a su actuación y a sus relaciones con sus semejantes. 

Toda persona consciente ha tenido muchas veces la necesidad de preguntarse, 
por ejemplo, ¿debo cumplir en cualquier circunstancia las promesas hechas?, ¿es 
malo mentir?, ¿hay obligación de delatar al traidor?, ¿debo revelar los hallazgos de 
mi investigación?, ¿debo realizar una investigación aunque esté convencido de que 
lo que se me pide es incorrecto?, ¿por qué tengo que obedecer a mis padres?, ¿por 
qué debo respetar la vida ajena?, ¿es lícito manipular a los estudiantes para 
aprovechar sus esfuerzos en forma desventajosa?, ¿debo presentarme ante los 
alumnos bien preparado, para conducir la clase, o simplemente es suficiente 
exponerles los textos?, ¿por qué tengo que pagar los impuestos si sé que beneficia- 
rán finalmente a la oligarquía y a la tecnocracia?, ¿por qué se castiga al drogadic- 
to?, ¿debo vengarme personalmente de las acciones de líderes corruptos? 

En estas situaciones —y otras muchas que se presentan- se advierte claramente 
que las personas tienen la necesidad de ajustar su conducta a ciertas normas que se 
reconocen como obligatorias o, por lo menos, como dignas de considerarse. Quien 
actúa de acuerdo con tales normas se comporta éticamente y merece la aprobación 
de los demás. Por ello, es necesario distinguir las acciones que están por completo 
al margen del orden ético y las acciones que pertenecen a tal orden. 

En todo caso, y suponiendo que haya personas que no se planteen proble- 
mas de índole ético, es un hecho innegable que todos juzgamos éticamente las 
acciones de los demás y las situaciones que se presentan. Esta es una práctica 
universal y constante. Lo hacen incluso aquellos que niegan validez a la ética. 

Las nociones de bueno, malo, justo, injusto, obligación, norma, ley, etcétera, 
son precisamente nociones éticas. Entonces, la ética es de uso cotidiano. 


15.3 ¿QUÉ ES LA ÉTICA? 


Subiré dice que el vocablo griego efhos tiene un sentido infinitamente más 
amplio que el que se da hoy a la palabra “ética”. Lo ético incluye, ante todo, las 
disposiciones del hombre en la vida, su carácter, sus costumbres y, naturalmente, 
también lo moral. En realidad, se podría traducir por “modo” o “forma” de vida, 
en el sentido profundo de la palabra, a diferencia de la simple “manera”. De esta 
manera surge el erhos, el modo de ser y de actuar, definido por las características 
que los hábitos dejaron en el ser 


15.31 Definición real 


Es la ciencia normativa de la actividad humana en orden del bien. 
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Por lo tanto, la ética como ciencia normativa establece leyes y normas para 
que el hombre sepa eligir el bien. Es la ciencia normativa de la actividad 
humana y por ello de la existencia humana en cuanto que ella (la ética) “implica 
una regla que vale por sí misma, un deber propiamente dicho, una obligación 
absoluta o categórica (sin pretender, sin embargo, que esta obligación sea ele- 
mento esencial de la moralidad). La ética es la ciencia de lo que el hombre debe 
hacer para vivir como debe vivir, para ses lo que tiene que llegar a ser, para 
alcanzar su valor supremo, para realizar en su naturaleza lo que se presenta 
como la justificación de su existencia, aquello hacia lo que y por lo que existe. 
En pocas palabras: la ética es una ciencia categóricamente normativa”. 

Sin embargo, hay varias clases de normas: jurídicas, sociales, religiosas, 
técnicas y finalmente éticas. 

Las normas éticas son las que dirigen la actividad humana en orden al bien. 
Abarcan los diferentes estratos de la persona; su vida, sus relaciones con un ser 
absoluto y con las demás personas. Estas normas éticas comprometen a la per- 
sona porque se dirigen al núcleo mismo de su ser y suponen y exigen el uso de 
la libertad; se refieren a su interioridad personal. 

De la definición de ética resultan sus objetivos. Entonces, el objetivo mate- 
rial de la ética —lo que estudia— son los actos humanos, la actividad específi- 
camente humana. El objetivo formal —un determinado aspecto del objeto 
material— es el bien, es la relación de la actividad humana a la norma ética. 

Si la ética es un conjunto sistemático de verdades acerca de la actividad 
humana, es una ciencia. Pero se necesita saber qué clase de ciencia es, porque en 
la actualidad se tiende a considerar como ciencias únicamente a las disciplinas 
empíricas. Si la ciencia se reduce a las disciplinas empíricas, no serán ciencias ni 
las matemáticas ni la historia, lo cual pocos admiten. Entonces se tiene que acep- 
tar que el ámbito de la ciencia es mucho más amplio que las disciplinas empíricas 


15.32 El método de la ética 


La mente procede de dos maneras en el conocimiento para la elaboración de las 
ciencias: por inducción o por deducción. En la inducción la mente pasa de lo 
particular a lo universal, de la observación de casos particulares al principio o 
ley universal para explicar algo particular o para obtener conclusiones o aplica- 
ciones concretas de lo general. 

El método inductivo, esencialmente empírico y a posteriori, es propio de las 
ciencias positivas que se pueden llamar indicativas y es el más apto para investi- 
gar y descubrir. El método deductivo, esencialmente analítico y a posteriori, es 
propio de las ciencias exactas y es el más adecuado para demostrar, es decir, 
para conocer la relación existente entre las ideas. 

El método de la ética no puede ser exclusivamente inductivo ni exclusiva- 
mente deductivo; es analítico-inductivo. En ética se tiene que conocer la realidad 
con todas sus situaciones por medio del método experimental. Pero tal procedi- 
miento no agota el ámbito de la ética, que es la ciencia del deber ser o del valor. 
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Por último, el fin de la ética es indicar el camino del bien. Y el bien es el 
objetivo al que se dirigen todas las actividades. Por eso, ya los antiguos habían 
observado que la virtud ayuda a vivir bien. Vivir bien es realizar el valor moral. 
Para saber qué es el valor ético se necesita saber qué es el valor, cómo se le co- 
noce, cuáles son sus propiedades, cómo se manifiesta. La axiología —teoría de 
los valores: del griego axios, digno de estima, valioso y logos, tratado— contesta 
estas preguntas. 


15.4 ÉTICA Y CIENCIA SOCIAL 


En un tiempo relativamente corto en que las ciencias sociales y el compor- 
tamiento han reclamado ser parte de la tradición científica, es sorprendente el 
poco interés que se ha dado a la ética. 

En realidad, se ha difundido mucho la idea de que las ciencias sociales están 
“libres de valor” o de “valor natural”. Los mitos de libres de valor y valor natu- 
ral se fundamentan en el dilema de que la ciencia describe lo que es el mundo, 
mientras la ética prescribe lo que el mundo debiera ser. 

En otras palabras, los científicos sociales, como científicos, suponen ser 
objetivos. Por lo tanto, las cosas no se debieran describir como uno desea que 
fueran, sino como ellas son. 

De acuerdo con este mito, el sociólogo, mientras investiga, protege al 
mundo externo de los valores personales. 

Si la ciencia fuera justamente la descripción de la realidad, no debería existir 
dilema alguno. Sin embargo, el dilema se expresa en una frase de la cita al princi- 
pio de este apartado: el conocimiento de la humanidad concede poder sobre la 
humanidad. El conocimiento científico no está finalmente divorciado de su uso 
por la humanidad porque los científicos no están interesados simplemente en 
describir la realidad actual, sino desean finalmente predecir los sucesos futuros. 

La ciencia como empresa descriptiva implica a la ciencia como predicción. 
La predicción podría conducir a un mayor control, y el control de otros seres 
humanos no es sólo una decisión científica, es también una decisión moral o 
ética. 

Algunos científicos sociales podrán objetar que las ciencias sociales y de la 
conducta se han limitado hasta ahora a ellas mismas, y a datos acerca de los 
seres humanos —que ellos tienen poco interés con la manipulación y el control 
de los seres humanos. Recientes sucesos apoyan el argumento de que las investi- 
gaciones sociológicas muestran creciente interés con la manipulación de los 
seres humanos. Pero al igual que en la investigación, donde la manipulación de 
los seres humanos no es evidente, tal comentario sólo enmascara los problemas 
éticos. 

Tal como hace notar Ernest Nagel: “. . . cualquier rama de la investigación 
que apunta a una confiable Ley General respecto a un asunto empírico impor- 
tante, tendrá que emplear un procedimiento que, si éste no es estrictamente una 
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experimentación controlada, tiene las esenciales funciones lógicas de investi- 
gación experimental”. 

En otras palabras, justamente porque un investigador nunca ha dependido 
de la investigación por medio de la experimentación no significa que él o ella 
pueden ser eximidos de producir conocimientos que estén sin la lógica de la 
experimentación. Por ejemplo, los sociólogos, que dependen fundamentalmente 
de los estudios o encuestas de investigación (y muchos lo hacen) usan en sus 
análisis técnicas cada vez en mayor grado, que se aproximan a los controles 
experimentales. 

En consecuencia, el control experimental es un asunto relativo. Una máxi- 
ma general de ciencia es que a mayor control que tiene el científico sobre los 
participantes en un estudio, más válidos son los descubrimientos o hallazgos. 
Paradójicamente, a mayor control experimental sobre los participantes ma- 
yores los problemas éticos creados. Como Friedrids ha observado acertada- 
mente, toda investigación científica tiene un compromiso implícito o explícito 
hacia el cambio. Así, aunque no está dispuesto a tomar al sociólogo como una 
especie de sacerdote sobrecargado del orden social, el investigador está forza- 
do, sabiéndolo o no, dentro de su posición intelectual. Supóngase que usted 
está intentando alguna nueva técnica educacional sobre la base de un experi- 
mento. ¿Con qué autoridad puede usted justificar mejor la educación de un 
grupo (el grupo experimental) que otro (el grupo control). O suponga que está 
estudiando algún tipo de comportamiento ilícito, ¿debería usted reportar esta ac- 
tividad a las autoridades? 

Mientras los científicos sociales y de la conducta están lejos de un completo 
consenso sobre un conjunto universal de reglas éticas que se deberían seguir en 
las investigaciones que incluyen seres humanos, existe entre ellos un acuerdo 
general de que el investigador estará preparado para responder a: ¿Son los obje- 
tivos del estudio proporcionales a los riesgos del estudio de los participantes 
(World Medical Association, 1964) U. S. Department of Health, Education and 
Welfare, 1971). 

Esto es: ¿Tienen mayor peso los beneficios científicos potenciales que 
cualquier posible riesgo con los participantes? Mientras una minoría de investi- 
gadores todavía piden un código de ética uniforme y absoluto para aplicarlo a 
todas las situaciones de investigación, otros afirman que todas las decisiones éti- 
cas deberían dictarse solamente por la conciencia del investigador; esto permite 
distinguir diferentes corrientes entre científicos del comportamiento, 

Los objetivos científicos actuales generalmente aceptados, el riesgo de las 
propuestas de los participantes ni siquiera un imposible y uniforme conjunto de 
éticas (absolutismo ético) ni por unas normas relativamente éticas dictadas por 
la conciencia individual del investigador (Beckes, 1964: 280; Dalton, 1964: 7 1). 

Por ética, el investigador debe de enfrentarse a las consecuencias del estu- 
dio, Aunque la mayoría de los investigadores observan esta regla, en la siguiente 
sección se verá que los pocos investigadores que ignoran esta ética máxima 
crean un clima insatisfactorio para la futura investigación. 
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En seguida se presentan algunos ejemplos contemporáneos de dilemas éti- 
cos resultantes de la investigación sobre el control de los seres humanos para 
llevar a cabo una discusión de algunos problemas éticos surgidos en esos 
ejemplos. A este comentario le seguirá una consideración de pasos que están 
tomando los científicos sociales y las entidades orientadas a las ciencias de la 
conducta para llegar a especificar mecanismos reguladores dentro del espíritu 
de lo que se ha llamado “los objetivos científicos vs. máximo riesgo de los 
participantes”. 


15.4.1 Ejemplos contemporáneos de ética 


Cada uno de los casos que se mencionan a continuación ilustra problemas de 
moral inherentes en el proceso de investigación. Esos casos historia intentan 
sugerir la necesidad de procedimientos de seguridad para regular la investi- 
gación social y conductual. Deberá hacerse notar que esos casos están lejos de la 
investigación típica social conductual. No obstante, muchos legos pueden distin- 
guir perfectamente entre las transgresiones de los pocos y la abrumadora ma- 
yoría de científicos éticos: 


+ Caso Goldzieher de anticoncepción. 

+ Proyecto Camelot. 

+ Caso Springdale. 

+ Estudio Tuskegee. 

+ Problemas de medición moderada. 

+ — Alterando estados de conciencia y estrés. 

+  Larespuesta al National Data Bank y los estudios longitudinales. 
+ Los lunáticos y el culto al día de juicio. Ñ 

+ Algunos casos recientes de fraude. 


15.5 LINEAMIENTOS Y SUGERENCIAS ÉTICAS 


Con los ejemplos antes mencionados se ha podido llegar a determinar un 
número de ejemplos específicos de problemas éticos y posibles formas para pre- 
venir o evitar repercusiones socio-políticas mientras se realiza la investigación 
profesional. Esos casos muestran claramente lo que representan y que el investi- 
gador no opera en un vacío. Los aspectos más sobresalientes de las investiga- 
ciones en los casos mencionados son, o se refieren, a lo siguiente: 


+ Tratamiento de los participantes en la investigación: 
— Confidencialidad. 


— Derechos de los participantes y bienestar. 
— Razón del riesgo de los participantes vs. beneficios potenciales. 


438 ÉTICA PROFESIONAL 


+ Responsabilidad de asociados. 
+ Algunos problemas profesionales. 


— Honestidad. 

— Precisión. 

— Tipo de diseño de investigación. 
— Efecto social de la investigación. 


15.6 DISCUSIÓN 


Se señaló que el científico social no está libre de valor o valor neutral en su 
investigación. Lo último que se puede preguntar a un investigador es 1) que él o 
ella tienen una conciencia de valores sesgados y cómo influyen en los esfuerzos 
del investigador y 2) que se intentó minimizar posiciones de valor en la investi- 
gación. Se ha establecido que los investigadores tienen un compromiso implíci- 
to, si no explícito, ya sea para cambiar o para con el status quo. 

Esos compromisos tienen implicaciones éticas que se tratarán con el investi- 
gador. Aunque existen muchas posiciones éticas y diferentes sobre la escala del 
relativismo ético al absolutismo ético, en la práctica, los científicos sociales bus- 
caron arduamente en la década pasada, lograr acuerdos comunes sobre las pautas 
éticas básicas y porque en la conducta del investigador se incluyen seres humanos. 

Es muy probable que las presiones cruzadas, presentadas por varios grupos 
de presión social trabajen contra el establecimiento de un código de ética uni- 
forme para la investigación científica. 

Un creciente número de sociólogos están conscientes que estos hechos no 
absuelven o eximen al investigador de responsabilidad ética. Como es cierto en 
cualquier otro rol, el rol del investigador incluye obligaciones como también 
derechos, y algunas de esas obligaciones son éticas en naturaleza. Esto no es 
negar que las obligaciones éticas no cambian. Lo que se considera ético en 
investigación hoy podría no ser considerado así mañana. Pero el investigador 
tiene la obligación de mantenerse consciente de tales cambios, no sólo por las 
razones morales sino también por razones prácticas que pueden dañar la repu- 
tación de la disciplina. Y será mucho más difícil para los científicos sociales 
realizar investigaciones de cualquier clase. 

Analíticamente, se ha tratado más con los derechos y obligaciones del 
investigador y estudios de los participantes. Cada vez se da menos atención a los 
derechos éticos y obligaciones del público o en la gran sociedad, en gran parte 
por su heterogenidad y, además, por sus inherentes presiones cruzadas que algu- 
nas veces crean demandas imposibles para el investigador. Mientras, los proble- 
mas giran en iorno a las obligaciones y derechos de la interacción sujeto-investi- 
gador, los problemas de ética entre cliente-investigador y las relaciones del 
investigador-la gran sociedad, interesan más los resultados o metas. 

Obviamente, esas distinciones se entremezclarán en alguna instancia. 
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15.7 CÓDIGO DE ÉTICA PROFESIONAL DE LICENCIADOS EN 
ADMINISTRACIÓN 


1.. Para los efectos del artículo 34 de la Ley General de Profesiones, el licen- 
ciado en Administración guardará el secreto profesional y no revelará por 
ningún motivo los hechos, datos y circunstancias de que tenga 
conocimiento en el ejercicio de su profesión, a menos que lo autoricen él o 
los interesados, y salvo los informes que obligatoriamente establezcan las 
leyes respectivas. Sin embargo, podrá consultar o cambiar impresiones con 
otros colegas en cuestiones de criterio o de doctrina, sin identificar a las 
personas o negocios de que se trate y podrá recomendar la implantación de 
métodos, procedimientos o sistemas establecidos o estudiados por él en 
otra empresa, siempre y cuando ello no tenga carácter de secreto profe- 
sional, y no se identifique a la empresa o negocio de que se trate. 

Estarán obligados a poner todos sus conocimientos científicos y recursos 
técnicos al servicio de sus clientes, para el desempeño de los trabajos 

convenidos. 

3. El licenciado en Administración sólo se podrá hacer cargo de un asunto 
cuando tenga capacidad para atenderlo e indicará claramente a sus 
clientes los alcances de su trabajo y limitaciones inherentes. 

4, El licenciado en Administración siempre deberá tener presente, como 
objetivo básico de su ejercicio profesional, la satisfacción de los intereses 
de la sociedad a la cual sirve. Deberá considerar que la retribución por 
sus servicios no constituye el objetivo principal del ejercicio de la profe- 
sión, E] monto de esa retribución ha de estar de acuerdo tanto con la 
importancia de las labores a desarrollar, como con el propio licenciado en 
Administración y los que le ayuden, destinen a esa labor y el grado de 
especialización que se requiera para que sus servicios sean satisfactorios. 

. El licenciado en Administración en ningún caso podrá conceder, directa o 
indirectamente, comisiones o corretajes por la obtención de un trabajo 
profesional. Sólo podrá conceder participación en los honorarios o utili- 
dades derivadas de su trabajo, a personas o firmas que sean sus colabo- 
radores en el ejercicio profesional. 

. El licenciado en Administración no podrá ofrecer o prestar servicios pro- 
fesionales a cambio de honorarios que dependan de la eventualidad de los 
resultados de tales servicios, excepto en los siguientes casos: 

Reclutamiento o selección de personal, asesorías o gestiones legales 

e fiscales y promociones de empresas, servicios o productos. 

El licenciado en Administración no garantizará ninguna cantidad especí- 

fica por concepto de reducción de costos o aumento de utilidades 

derivadas de sus esfuerzos. 

. El ficenciado en Administración no hará ofertas directas o indirectas de 

trabajo a los empleados de los clientes. Dichos empleados le solicitan tra- 
bajo en su despacho o con otro de sus clientes afectados, antes de iniciar 
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alguna negociación con tales empleados, deberá obtener el previo consen- 
timiento del cliente afectado, 

9. Los licenciados en Administración miembros del Colegio que prestan tra- 
bajos profesionales cuya remuneración no esté comprendida en los 
aranceles que se establezcan, deberán celebrar contrato con sus clientes, 
en el que estipulen los honorarios y los derechos y obligaciones que con- 
traigan ambas partes. 


15.7.1 Como profesional independiente 


1. El licenciado en Administración deberá actuar en todo tiempo con la 
máxima imparcialidad de criterio. Podrá representar a su cliente en nego- 
ciaciones ante terceros. En sus actuaciones con el personal del cliente, 
apoyará a quienes en su concepto tengan la razón, sin tomar en cuenta su 
jerarquía o cualquier otra consideración. 

2. No deberá solicitar o aceptar comisiones de ninguna empresa o interesa- 
do, de los que pudiera obtener algún ingreso o beneficio como resultado 
de su recomendación, 

3. En los casos en que el licenciado en Administración participe en la 
administración o propiedad de alguna institución que pueda prestar un 
servicio auxiliar o complementario a su cliente, y que pueda verse favore- 
cida por su recomendación ineludiblemente el licenciado en Adminis- 
tración deberá hacer del conocimiento de su cliente tal situación. 

4, El licenciado en Administración no deberá actuar como árbitro en algún 
asunto en que una de las partes sea o haya sido su cliente, o se hayan 
entablado pláticas para explorar la posibilidad de que lo sean en el futuro. 

5, Cuando el licenciado en Administración emita su dictamen, opinión o 
cualquier otra información para fines públicos, y el que terceras personas 
hayan de tomar como referencia para tomar decisiones, deberá mantener 
una absoluta independencia de criterio, aun cuando aquellas cuestiones 
puedan ser perjudiciales para su cliente. 

6. El licenciado en Administración no realizará gestiones de contratación de 
trabajo con un cliente al cual le esté prestando servicios otro licenciado 
en Administración salvo con conocimiento de éste cuando el trabajo sea 
en la misma especialidad. 


15.7.2. De la difusión de servicios 


1. Por considerar que cualquier divulgación de los servicios profesionales 
del licenciado en Administración hecha en forma exagerada, poco seria o 
basada en autoelogios, redundaría en desprestigio de la profesión, el 
licenciado en Administración no utilizará medios publicitarios para divul- 
gar sus servicios o promover en cualquier forma su empresa, sólo podrá 
utilizarlos para anunciar la apertura de ofícinas o cambios de domicilio en 
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forma discreta, y aparecerán cualesquiera de los datos esenciales de la 
empresa; razón social, su carácter, dirección, teléfonos y nombres de los 
socios. 

2, El licenciado en Administración podrá divulgar el carácter de sus servicios 
y las características de su empresa siempre que ello no implique autoelo- 
gios y se efectúe exclusivamente entre clientes y prospectos, pudiendo 
utilizar los medios que el propio Colegio le proporcione o avale, como 
seminarios, mesas redondas, cursos, conferencias, y en publicaciones. —. 


15.7.3 Relación entre profesionales 


. El licenciado en Administración no usará información, materia) técnico o 
procedimientos aún no públicos de otros colegas, sin obtener consen- 
timiento por escrito. 

. En los casos en que el licenciado en Administración utilice la informa- 
ción, el material técnico o procedimientos de otros colegas que se hayan 
hecho públicos, tendrá la obligación de darle el crédito a la fuente origi- 
nal de información. 

. Cuando el licenciado en Administración desee hacer ofertas de trabajo a 
un asociado o empleado de otro compañero de profesión, deberá hacerlo 
del conocimiento de su colega. 

4. El licenciado en Administración podrá revisar el trabajo realizado por 

otro colega, haciendo que éste tenga conocimiento previo de ello. 

5. Contando con pruebas concluyentes, el licenciado en Administración ten- 

drá la obligación de informar por escrito al Colegio de Licenciados en 

Administración de la entidad a que corresponda, de cualquier desviación 

a lo establecido por este Código de Ética, cometida por otro colega, 
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158. ALGUNOS ARTÍCULOS DEL CÓDIGO DE ÉTICA 
PROFESIONAL DE CONTADORES 


+ Articulo 1.06. Las opiniones, informes y documentos que presente el 
contador público deberán contener la expresión de su juicio fundado en 
elementos objetivos, sin ocultar o desvirtuar los hechos, de manera que 
Puedan inducir a error y tomando en cuenta las declaraciones oficiales 
del Instituto. 

+ Artículo 1. 11. El contador público no deberá utilizar sus conocimientos 
profesionales en tareas que no cumplan con la moral. 

+ Artículo 1.13. Ningún contador público podrá obtener ventajas 
económicas directas o indirectas por la venta al patrocinador de su tra- 
bajo, de productos o servicios que él haya sugerido en el ejercicio de su 
profesión, excepto de aquellas que le sean propias a su actividad como 
contador público. 


442 


ÉTICA PROFESIONAL 


Artículo 1. 14. El monto de la retribución económica que perciba el con- 
tador público ha de estar de acuerdo con la importancia de las labores 
por desarrollar, el tiempo que a esa labor se destine y el grado de espe- 
cialización requerido. 

Artículo 1,19, El contador público deberá cimentar su reputación en la 
honradez, laboriosidad y capacidad profesional, observando las reglas 
de ética más elevadas en sus actos y evitando toda publicidad con fines 
de lucro o autoelogio. No deberá anunciarse o solicitar trabajo por con- 
ducto de medios masivos de comunicación o de otros que menoscaben 
la dignidad del contador público o de la profesión en general. 

Artículo 2.09, El contador público no deberá ofrecer trabajo directa ni 
indirectamente a funcionarios o empleados de sus clientes, si no es con 
previo conocimiento de éstos. 

Artículo 2.10. El contador público en ningún caso podrá conceder comi- 
siones o corretajes por la obtención de un trabajo profesional. Sólo 
podrá conceder participación en los honorarios o utilidades derivadas de 
su trabajo a personas o asociaciones con quienes comparta el ejercicio 
profesional. 

Artículo 3.01. El contador público que desempeñe un cargo en los sec- 
tores privado o público no debe participar en la planeación o ejecución 
de actos que puedan calificarse de deshonestos o indignos, o que origi- 
nen o fomenten la corrupción en la administración de los negocios o de 
la cosa pública. 

Artículo 4.01. El contador público que imparte cátedra debe orientar a 
sus alumnos para que en su futuro ejercicio profesional actúen con 
estricto apego a las normas de ética profesional. 

Artículo 4.04, El contador público en la exposición de su cátedra podrá 
referirse a casos reales y concretos de los negocios, pero se abstendrá de 
proporcionar información que identifique a personas, empresas o insti- 
tuciones relacionadas con dichos casos, salvo que los mismos sean del 
dominio público o se cuente con autorización expresa para el efecto, 
Artículo 5.05. El contador público catedrático en sus relaciones con los 
alumnos deberá abstenerse de hacer comentarios que perjudiquen la repu- 
tación o prestigio de alumnos, catedráticos, otros contadores públicos o 
de la profesión en general. 
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Casos de investigación 


A1.1 CASO DE INVESTIGACIÓN EN 
RECURSOS HUMANOS 


A1.1.1 Problemática 


En muchas organizaciones del país existen aumentos en los costos de produc- 
ción de bienes y servicios debido en su mayoría a ineficiencia en el trabajo por 
faltas injustificadas de los trabajadores. 


A1.1.2 Elementos 


Es ampliamente conocido que en México se tienen muchos días de descanso 
además de los señalados por la Ley Federal del Trabajo. Los días de asueto no 
obligatorio se deben a situaciones culturales, familiares y sociales, 

Se desea saber cuáles son las causas que afectan al trabajador mexicano 
para dejar de asistir a sus labores; así, utilizando el método científico se investi- 
garía: 


+ ¿Se deben las inasistencias a problemas de transporte? 

+ ¿Se deben los retardos e inasistencias a que no se tiene un estilo de direc- 
ción adecuado? 

+ ¿Hasta qué nivel influye la deficiente alimentación del trabajador mexi- 
cano en el problema? 

+ ¿En qué grado influye el temor a perder el empleo por no asistir a sus 

labores? 

¿Existe incidencia entre las festividades religiosas y las inasistencias? 
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» ¿Existe incidencia entre el problema familiar e inasistencias? 
+ ¿Existe incidencia entre alcoholismo e inasistencias? 


A1.1.3 Alcances 


La investigación de referencia se llevaría al cabo en una región localizada a 60 ki- 
lómetros del Distrito Federal, específicamente en PIST (Parque Industrial San- 
tiago Tianguistenco), en donde se concentran industrias de manufactura, de 
vestuario y de transportes de carga, principalmente, 

El transporte de trabajadores de la ciudad de México a este Parque Indus- 
trial así como de las ciudades circunvecinas al citado centro, es deficiente y 
escaso. Las corridas de los autobuses son poco frecuentes por lo que si un traba- 
jador se retrasa pocos minutos, tiene que esperar hasta una hora para abordar el 
siguiente autobús. Parece ser que en este caso, el trabajador opta por faltar a sus 
labores y utiliza el tiempo en labores artesanales familiares, ya que la mayor 
parte de los trabajadores pertenecen a grupos familiares de artesanos, 

Es ampliamente difundida la versión de que México pertenece al modelo de 
comportamiento “X” de Douglas McGregor, Así, en el mayor de los casos, los 
estilos de liderazgo gerencial toman el modelo anterior. Sin embargo, esta afir- 
mación aceptada tiende a cambiar debido a la fuerte influencia que el vecino 
país del norte tiene en la población, También han ocurrido hechos por los que el 
trabajador ha cambiado su comportamiento, estos son: nacionalización bancaria, 
devaluaciones y control de cambios. Por lo que al no aceptar el estilo de lideraz- 
go, lo rechace y lo demuestre con sus inasistencias. 

Desde otro punto de vista, se ha afirmado que el trabajador en México labo- 
ra por hambre; esto quiere decir que el motivador principal es el hambre, sin 
embargo, existe una contradicción, porque si así fuera el trabajador no faltaría a 
sus labores, 

Es necesario entonces, investigar hasta qué nivel incide este motivador del 
hambre en el problema, En el libro de José Rubén Romero, “Pito Pérez”, se afir- 
ma que México es hambre. 

Otro factor por considerar es el temor a perder el empleo, en donde el traba- 
jador no siente presión sobre este hecho, debido en su mayor parte a la fuerte 
unión que predomina en la familia mexicana. Por tanto, si falta a su trabajo y lo 
despiden por abandono, siempre será bien recibido en el seno familiar y ayudado 
mientras localiza otra fuente de empleo. 

El último factor por considerar en esta investigación es investigar si las fes- 
tividades religiosas de la región inciden con las inasistencias. 

Así, en el Parque Industrial de referencia se presenta un alto grado de ausen- 
tismo durante julio debido a la celebración religiosa en los pueblos vecinos. De 
la misma forma, en enero y febrero se celebra una peregrinación anual a la Villa 
de Guadalupe de la ciudad de México en la que participa un gran número de tra- 
bajadores motivados por sus creencias religiosas. 
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A1.2 CASO DE INVESTIGACIÓN EN CON 


A12.1 Problemática 


La contaduría pública no conoce con profundidad el Código de Ética Profesio- 
nal, por consecuencia no ponen en práctica sus lineamientos. 

La falta de conocimiento puede ir en demérito de los servicios contables y 
de la profesión en general. 


A1.2.2 Elementos 


La contaduría pública mexicana organizada tuvo en sus orígenes una influencia 
decisiva por parte de la contaduría de Estados Unidos y ésta por Inglaterra y 
País de Gales; así en México se dio a conocer e) Código de Ética Profesional 
que todo contador público debe acatar. 

La contaduría pública como profesión liberal cuenta con lineamientos éti- 
cos, los cuales provienen de actos ilícitos a los miembros de la profesión. 

El 1.M.C.P. (Instituto Mexicano de Contadores Públicos), órgano rector de 
esta profesión, agrupa a todos los profesionistas del país y está encargado de le- 
gislar sobre el citado código. 

Si se le preguntara a un profesional de la contaduría qué actitudes tomar en 
las siguientes situaciones: 


+ Actuar como comisario y auditor externo en la misma empresa. 

+ Participar en concurso con otros miembros de la profesión para obtener 
un contrato de prestación de servicios profesionales. 

+ Obtener un porcentaje en el estudio del lanzamiento de un producto, si es 
que éste tiene éxito. 

+ Anunciar sus servicios profesionales en medios masivos de comunicación 
como el radio y la televisión. 

+ ¿Es posible que el profesional en contaduría pública cuando actúe en el 
campo docente pueda transmitir experiencias profesionales revelando 
cifras e identidad de las empresas? 


Para lo anterior se pediría que sus decisiones estuvieran basadas en los li- 
neamientos que señala el Código de Ética Profesional. Se llegaría a determinar 
que los profesionales de contaduría no conocen y no practican su código de ética. 


A1.22,3 Alcances 


La investigación se avocaría a conocer en qué grado los contadores públicos 
conocen y practican su código de ética profesional, 

Este estudio se realizaría en los sectores de actuación profesional reconoci- 
dos por el propio IMCP como son: 
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+ Sector independiente. 
+ Sector privado. 
+ Sector público. 
* Sector docente. 


Es importante señalar que el poco conocimiento científico que se da en el 
área contable ha sido enfocado a los sectores independiente y privado y reciente- 
mente al sector público y se ha descuidado el sector docente, siendo éste vital 
para la función académica. 

Las universidades tienen un papel de suma importancia, debido a que en 
ellas se forman a los futuros contadores públicos, y es ahí donde se les debe en- 
señar por profesionales que conozcan a fondo su código de ética. 

Considero que este tema de investigación es de vital importancia debido al 
momento histórico que se vive, referente a la renovación moral de la sociedad 
emprendida principalmente por la Secretaría de la Contraloría General de la Fe- 
deración. 


A13 CASO DE INVESTIGACIÓN EN CO: 


A1.3.1 Problemática 


Los precios en la industria del hierro y el acero son elevados en comparación 
con otras industrias. Lo anterior se debe a los altos costos de la producción. 


A1.3,22 Elementos 


El índice inflacionario cada vez más alto que padecemos ha incidido en que los 
costos en la industria mencionada sean en muchos casos inalcanzables como 
insumos de producción. 

De la misma forma en industrias conexas como la de construcción se han 
alcanzado precios y costos altos. 

Analizando los costos de producción en la industria se observa que el precio 
aumenta debido a gastos de transportación marítima y terrestre. 


A1.3,3 Alcances 


Una firma de contaduría pública avocada a este problema debe investigar el 
aumento en esos rubros financieros y concluir cómo incide el siguiente factor y 
en qué proporción. 

La materia prima del hierro y el acero es el material conocido comúnmente 
como “chatarra”, el cual es material de importación. 

La revisión incluiría: 
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+ ¿Cuáles son las principales fuentes de abastecimiento de la citada materia 
prima? 

» ¿A qué distancia se encuentran y cómo influye ésta en el aumento del 
costo del material? 

» ¿Son las fuentes de abastecimiento las más adecuadas? 

» ¿Se utiliza el transporte más efectivo para su traslado? 


Por estudios realizados en el área de contabilidad de costos, se ha llegado a 
determinar que gran porcentaje de empresas productoras de hierro y acero se 
abastecen de materia prirna “chatarra” en Estados Unidos, principalmente en 
Texas. 

Por lo tanto, el costo industrial se aumenta por el traslado terrestre del lugar 
de abastecimiento al puerto de Galveston, de ahí se incluye el transporte maríti- 
mo hasta Veracruz y al final se aumenta el traslado de este puerto a donde se 
localiza la empresa productora de referencia. 

Este estudio iniciado por el área de contabilidad puede ampliarse a otros 
campos: 


+» Distribución de mercados. 
+ Localización de plantas industriales. 
+ Política de precios al consumidor. 


La importancia de este estudio radica en verificar la eficiencia de la admi- 
nistración viéndose reflejada en la contabilidad de costos de la industria del hie- 
rro y el acero. 


A14 CASO DE INVESTIGACIÓN EN CONDUCTA 
ORGANIZACIONAL 


A1.44.1 Problemática 


Existe gran número de organizaciones en México, donde se acostumbra el 
“coffee break” (tiempo para tomar café) como en las empresas norteamericanas. 

En muchos casos, el tiempo libre para este descanso, se deja a libertad del 
trabajador y éste toma más del tiempo requerido, por lo que la ineficiencia en 
el trabajo se traduce en retardos en la producción. 


A1.4.2 Elementos 


Se sabe que el pueblo mexicano, en general, pertenece a la tipología de compor- 
tamiento “X” según Douglas McGregor. Según este autor, los miembros de este 
tipo de dependientes, no desarrollan creatividad y necesitan una gran dosis de di- 
rección autocrática para el trabajo. 
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Con estas características coinciden muchos autores en la literatura espe- 
cializada en nuestro país como: Santiago Ramírez (1977) en El Mexicano, Psi- 
cología de sus Motivaciones y Rogelio Díaz Guerrero (1977) en Estudios de 
psicología del mexicano. 

En general, la dependencia que requiere el trabajador en México, se debe en 
parte al aspecto formativo familiar; así el niño mexicano aparece en el seno 
familiar siempre con ura relación muy estrecha con su madre, porque en nuestra 
cultura ésta es quien se en-arga de cuidar a los hijos. 

Esta dependencia permanece y aflora a través de los años cuando el niño se 
convierte en trabajador, la figura materna la lleva en sí mismo y las veces de 
ésta las realiza el supervisor o jefe de área. 

Desde otro punto de vista, según Heert Hofstede (1980) en Culturel's Conse- 
quences: International Differences in Work Related Values, afirma que los tra- 
bajadores en México requieren de un alto grado de membresía. 

Lo anterior se debe a la fuerte unión que se presenta en los lazos familiares, 
el individuo es miembro de una familia donde tiene poder, prestigio y recono- 
cimiento. Los centros de trabajo reemplazan la membresía familiar fuera del 
hogar. 


A1.4.3 Alcances 


El estudio de referencia se realizó en una empresa trasnacional, con matriz en el 
estado de Indiana, Estados Unidos de Norteamérica, donde se ha acostumbrado 
otorgar al trabajador quince minutos de descanso para tomar café. 

Esto se determinó con base en estudios realizados por especialistas en el 
comportamiento quienes desc'brieron que el trabajador, después de tres horas 
de jornada continua, tiende a disminuir su nivel de eficiencia, era necesario en 
ese punto otorgarle un descanso. 

Al regresar de tomar café aumentaba el nivel de eficiencia y llegaba a un 
punto máximo, donde requeriría de otro descanso; y éste coincidía con el tiempo 
libre para el almuerzo, después de este descanso mantenía la eficiencia a un 
nivel aceptable, pero al pasar el tiempo límite de tres horas el nivel de eficiencia 
disminuía; sin embargo, su descanso ya era merecido, era la hora de salida. La 
empresa filial localizada en la ciudad de México implantó la misma modalidad 
que la casa matriz. 

Es importante mencionar que el tiempo requerido para el “descanso del 
café” fue dado a discreción de los mismos trabajadores, tomando en conside- 
ración su responsabilidad. 

La primera semana al parecer, por ser nueva situación en la empresa, la 
mayoría de los trabajadores regresó a sus labores no después de 30 minutos. 

A la segunda y tercer semanas, el tiempo se extendió debido a que se había 
incluido en el “descanso del café” alimentos típicos para el almuerzo. De esta 
manera, al finalizar ese mes la producción y las ventas sufrieron bajas consi- 
derables debido al gran atraso de todo el personal al regresar a sus labores des- 


CASO DE INVESTIGACIÓN EN CONTABILIDAD DE INVENTARIOS 451 


pués del descanso del café. El problema radica en investigar por qué no se 
respetaron en igualdad de circunstancias, las mismas órdenes giradas para el 
“coffee break” en la casa matriz de Indiana que las mismas órdenes dadas en la 
filial de la ciudad de México. 

Lo anterior es un problema de investigación que incluye el aspecto de trans- 
ferencia tecnológica donde se debe de considerar: 


+ Primera etapa: Réplica. 
+ Segunda etapa: Adaptación. 
+ Tercera etapa: Apropiación. 


La experiencia anterior muestra que únicamente en México se llegó a la 
primera etapa, dejando sin efecto la segunda y tercera. 


A1.5 CASO DE INVESTIGACIÓN EN CONTABILIDAD 
DE INVENTARIOS 


AL5,1 Antecedentes 


Usted es el Director de Administración de una institución de servicio público y 
su principal misión es prestar actividades de apoyo a toda una estructura dis- 
tribuida en el territorio de una entidad federativa. Las áreas que maneja su direc- 
ción son: Recursos Humanos, Control Presupuestal, Organización y Sistemas y 
Recursos Materiales. El área por servir consta de tres divisiones: Institución 
(geográficamente desconcentradas), zona norte, zona oriente, zona sur-poniente, 
Cada zona está dividida en niveles municipales, que es el último nivel en el que 
su organización presta el servicio. Cada zona tiene en promedio 40 oficinas 
municipales; cada una de ellas da un servicio potencial promedio a 75,000 habi- 
tantes/año y promedio real de 1,000 habitantes/año, lo que significa que en 
promedio real el 1.33% de la población acude anualmente a sus oficinas. Estas 
cifras las preparó uno de sus asesores con base en ciertas estadísticas que se 
elaboraron en el área de Organización y Sistemas. 


A1.5.2 Actualidad 


Usted elabora actualmente el presupuesto para 1985, y su jefe, máxima autori- 
dad en la institución le pido respecto a la elaboración del presupuesto que ob- 
serve: 


1. Manejo completamente austero. 

2. Estimación correcta de las auténticas necesidades. 

3. Una justa asignación de la derrama presupuestal. 

4. En suma, un muy racional enfoque de planeación presupuestal. 
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A1L5.3 El problema 


En los últimos ejercicios presupuestales usted ha observado que uno de sus prin- 
cipales problemas se encuentra en las funciones de compras y almacén. En com- 
pras debido a que se ha venido manejando con el enfoque de “apaga-fuegos” en 
algunos casos y en otros haciendo compras “poco racionales” (aleatorias). En el 
almacén, debido a que cada encargado de oficina municipal y el resto de oficinas 
administrativas se presentan al almacén a solicitar materiales y equipo cada vez 
que se les ocurre, justificando su petición con el argumento de “ya se acabó y 
urge”. Cuando hay material se surte inmediatamente, en caso contrario, se reali- 
zan compras “apaga-fuego”. 

Usted, para solucionar este problema, no dispone de contabilidad (contro- 
les) por lo que sus asesores le recomiendan. 


A1.5.4 Solución 


Realizar una investigación de campo, en las oficinas municipales para cono- 
cer consumos reales de materiales y equipo. Sin embargo, como el tiempo no pa- 
rece ser su aliado, cada vez le es más difícil realizar una investigación en las 
120 oficinas municipales; por lo que decide hacer un muestreo de acuerdo con 
las siguientes bases: 


Oficinas municipales 
Zonas 
Tipo Población Número 
Oriente | Norte | Sur-Poniente 

A Más de 310,000 4 1 2 1 
B 220,001 — 310,000 hab. 8 2 4 2 
el 130,001 — 220,000 hab. 13 5 2 
D 40,001 — 130,000 hab. 35 2 10 13 
E Hasta 40,000 hab, 60 13 24 18 

120 38 42 40 


Las zonas tienen una importancia relativa de: 


Oriente — 31.66% 
Norte — 35.00% 
Sur-Poniente — 33.34% 


100.00% 
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Los tipos de oficinas municipales tienen una importancia relativa de: 


— 3.34% 
— 6.61% 
10.83% 
— 29.16% 
— 50.00% 

100.00% 


ES 
| 


Entonces decide tomar una muestra del 20% del total de 120 oficinas mu- 
nicipales, lo que significa: 


Oficinas municipales 


Zonas 


Sur-Poniente Oriente 


Entonces investigará 24 oficinas municipales de acuerdo con la distribución 
del gráfico anterior y obtendrá datos sobre: 


+ Consumo diario de material. 

+ Utilización diaria de equipo. 

+ Aforo diario de individuos que acuden a la oficina. 

Una vez recopilados y procesados los datos anteriores se podrán planear las 
compras e inventarios, para finalmente elaborar el presupuesto. 


A1.6 CASO DE INVESTIGACIÓN EN LA 
CONTRALORÍA LOCAL 


AL6.1 Antecedentes 


Usted es el Fiscal del Gobierno de una entidad federativa quien tiene ya cier- 
ta curva de aprendizaje en el registro de la manifestación de bienes (más de 
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25 años) de sus servidores públicos. Por obligación legal, el servidor público al 
ingresar al Gobierno y al salir, debe presentar una declaración que presente en 
pocas palabras su contabilidad personal; es decir, el detalle de sus cuentas de 
activo, pasivo y capital; al esquematizar lo anterior explica: 


Ingreso del Salida del 
servidor público servidor público 


Pesición - = 
Pasivo Tiempo Pasivo 

Financiera = = 
Capital Tiempo Capital 


El control anterior se ha venido desarrollando como apoyo a la Fiscalía del 
Fuero Común y ha servido para la estimación de ciertos alcances: cuyo nivel de 
confianza no es satisfactorio permite dar ciertos indicios, para la determinación 
O presunta responsabilidad en el delito de enriquecimiento inexplicable. 


A1.6.2 Actualidad 


Usted actualmente ve el registro de manifestación de Bienes, como un control 
más, y esto se comprueba cuando verifica que la consulta en ilícitos cometidos 
por el burócrata; la autoridad competente prefiere investigar otras fuentes. 

Últimamente se ha puesto de moda (o más apropiadamente) ha cobrado 
fuerza la atención ciudadana en la responsabilidad de funcionarios y empleados 
públicos; el pueblo quiere “paredes de cristal”; la investigación y prosecución 
deben estar al día. 


AL6.3 El problema 


Usted como Fiscal Estatal, automáticamente es asesor jurídico del gobierno; por 
lo que el ejecutivo local le pide elabore un proyecto para una nueva Ley en 
materia de Control de Bienes. Una de las fuentes que usted consulta será la his- 
toria, otra la realidad consuetudinaria. Sin embargo, usted carece de elementos 
que apoyen su racional contribución, desea información objetiva, no subjetiva. 
Por lo anterior, se decide a practicar una investigación. 


CASO DE LA INVESTIGACIÓN EN LA CONTRALORÍA LOCAL 455 
A1.6.4 La solución 


El Gobierno en que usted labora, agrupa a más de 150,000 servidores públicos, 
algunos de reciente ingreso, la mayoría con más de tres años de antigiledad, y el 
resto son jubilados o gente que acaba de dejar de prestar sus servicios. 

Para poder apoyar el diseño de la nueva Ley, diseñará un sistema de captura 
de información, el cual, además de conservar las variables incluidas en el diseño 
anterior, adicionará elementos tales como la inflación, y sobre todo, el efecto de 
los resultados en el tiempo. 


(Ingresos — Egresos) 
Tiempo 


O sea que usted realizará un análisis muestral de los servidores públicos 
con el fin de conocer realidades y potencialidades en el enriquecimiento ilí- 
cito. 

Así que, con la orden del señor Gobernador, la estructura staff de la entidad, 
se prepara a ayudarle en lo conducente: 


1. La Dirección General de Personal aleatorizará la muestra junto con la 
Dirección General de Organización. 

2. La Dirección General de Planeación, en combinación con la Dirección 
General de Informática, elaborarán el software para la investigación. 


El objetivo central es: Conocer el cambio de la posición financiera del servi- 
dor público en el tiempo, midiendo el efecto que tiene el diferencial del ingre- 
so-egreso, además de la inflación. Teniendo cuidado de separar los ingresos 
adicionales y legalmente permisibles. 


EL ESQUEMA INCLUIRÍA: 
MEDICIÓN Y EVALUACIÓN 
Ingreso del Salida del 
servidor servidor 


público público 


456 CASOS DE INVESTIGACIÓN 


INFLACIÓN; REVALUACIÓN 


ACTIVO ACTIVO 
Situación = dE 
financiera PASIVO. ———— > PASIVO 
CAPITAL. == CAPITAL 
TIEMPO 
A+ > 
01:72 a __ == 2 
INGRESO E-=-————_——= EGRESO 
EGRESO 2 EGRESO 
Resultados = = 
UTILIDAD UTILIDAD 
> A 
O PÉRDIDA O PÉRDIDA 
*Disminución de pasivo, aumento de activo o capital 
Efectos 


**Disminución de activo o capital, aumento de pasivo 


APÉNDICE 


2 


Mapeo de referencias bibliográficas 


A2.1 INTRODUCCIÓN 
Para elegir el tema, básicamente se toman en cuenta tres aspectos:) 


1. El tema comprenderá las áreas de contabilidad y administración simultá- 
neamente, 

2. El tema debe de abarcar aspectos de los estudios más recientes que se han 
realizado en estas áreas. 

3. Que los resultados de la investigación pudieran servir para futuras inves- 
tigaciones o estudios. 


El campo que se eligió es el de Administración teniéndose como área la de 
autores mexicanos que han escrito en líneas de trabajo referentes a la adminis- 
tración: relaciones humanas, derecho, auditoría y los cinco principales elemen- 
tos que integran una de las teorías de la administración, tales como: planeación, 
integración, organización, dirección y control, 


Campo — Administración 
Área — Autores mexicanos 
Línea de trabajo — General 


"Enrique Gutiérrez López, Modelo de referencias bibliográficas, trabajo del programa de doctorado, 
F.C. y A. UNAM, México, 1984, inédito. 
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A2.1.1 Proceso de captura de información 


1. Se determinó el tema de mapeo. 

2. Se buscó en el Secobi la información respectiva, habiéndose manifesta- 
do que era un campo limitado. 

3. Se consultó con los maestros, quienes indicaron que si no se tenían sufi- 
cientes autores, se podría hacer el mapeo sobre las referencias que uti- 
lizan los autores mexicanos. 

4. Nuevamente se solicitó al Secobi la información, pero se indicó que no 
les era posible conseguirla ya que la clasificación no especificaba 
nacionalidad de autores y se recalcó que a juicio de ellos eran pocos los 
mexicanos que escribían sobre este tema. 

5. Se decidió hacer el mapeo sobre títulos de autores mexicanos en vez de 
personas. 

6. Se consiguió la información necesaria en la ESCA, en la Escuela 
Comercial Bancaria y Escuela Tecnológica de Telmex, así como en bi- 
bliotecas particulares, 


A2,2 CRITERIOS DE CLASIFICACIÓN DE LAS REFERENCIAS 
CAPTURADAS 


Las agrupaciones están ordenadas por número de publicaciones citadas y por 
agrupación de trabajos similares, A = Número progresivo de lista, B = Número 
de trabajos citados, C = Títulos agrupados. 


A B e 
1 14 01 Administración 
2 18 10 Relaciones humanas 
3 7 08 Organización 

4 04 Administración pública 
5 4 07 Derecho administrativo 
6 3 02 Administración financiera 
7 3 05 Auditoría administrativa 
8 2 03 Administración industrial 
9 2 06 Control 

10 2 09 Producción 


Criterios de frecuencia de agrupación de áreas del campo de investigación 
de la Administración realizada por autores mexicanos. 
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A2.2.1 


E 
10. 


Justificación de criterios 


. Relaciones humanas. Se consideran todos aquellos aspectos relaciona- 


dos con el personal, tales como: administración de recursos, análisis de 
Puestos, comportamiento, sueldos y salarios, etcétera. 


. Auditoría. Este es un criterio bien definido y aunque es una función de 


control, se trata por separado a fin de hacer más amplio el mapeo y 
menos específico. 


. Administración financiera. Aquí se incluyen aspectos presupuestarios y 


control financiero. 


. Producción. Es una rama muy importante de la administración. 
. Administración pública. Los textos sobre este tema se limitan a esta 


rama de la administración. 


. Administración. Este es el criterio más general y se consideran temas de 


introducción, estudio, inicio, etcétera., sobre todo lo que no especifica 
Una rama particular, 


. Administración industrial. Aspectos de mantenimiento y otros rela- 


cionados con la industria. 


. Organización. Funciones que detallan este paso del proceso adminis- 


trativo, 
Derecho. Textos de derecho administrativo, 
Control. Otro paso del proceso administrativo. 


Justificación de las relaciones de los criterios de clasificación establecidos 
en el mapa. 

Después de haber seleccionado las líneas de trabajo y justificado su criterio, 
se buscó su relación de acuerdo con el contenido del título del libro, su índice 
general de temas, prólogos y su introducción, de esta manera se identificaron sus 
relaciones entre las líneas de trabajo. 

Administración. De acuerdo con estos criterios se encontró que hay 
relación en los temas que tratarán los diferentes autores con: Derecho adminis- 
trativo 3), Administración industrial 3), Administración financiera 2), 
Relaciones humanas 4), Control 4). 


Ejemplo: 


Administración-Organización 
La organización es uno de los elementos de la administración. 


Administración — Control 
Por ser otro de los elementos de la organización. 
Las relaciones con la administración son obvias. 
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A2.3 MAPEO DE TÍTULOS AGRUPADOS POR LÍNEAS DE 
TRABAJO DE AUTORES MEXICANOS EN ADMINISTRACIÓN 


A CONTROL 3 
9 2 06 


2 
71 


ADMINISTRACIÓN 
FINANCIERA 
6 3 02 


PRODUCCIÓN 
10, 2, 09 


ADMINISTRACIÓN 
INDUSTRIAL 
8 2 03 


14, 01 


ORGANIZACIÓN 
3, 08 


AUDITORÍA RELACIONES DERECHO 
ADMINISTRATIVA HUMANAS ADMINISTRATIVO 
, 05 2 5, 4, 07 


ADMINISTRACIÓN 
PÚBLICA 
0 


Figura 5.12 Criterio de clasificación por líneas de trabajo. 
Fuente: Enrique Gutiérrez Lóipez, F.C. y A. UNAM, Doctorado. 
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A2.4 LISTADO DE REFERENCIAS POR LÍNEA DE TRABAJO, 
AUTOR, FECHA, TÍTULO, EDITORIAL 


A2.4.1 Administración 


Castillo M., Wilfrido “Así nació la Carrera de Administración de Empresas”. 
Colegio de Licenciados en Administración, 1970. 

Chávez F.. Oscar “Técnicas Modernas de Administración”. Instituto Mexicano 
de Contadores Públicos, 1972. 

Fernández A., José Antonio “Introducción a la Administración”. UNAM, 1970. 

Guzmán V., Isaac “Reflexiones sobre la Administración”. Reverté, 1961. 

Guzmán V., Isaac “Problemas de la Administración de Empresas”. Limusa, 
1965. 

Guzmán Y. Isaac “La Ciencia de la Administración”. Limusa, 1966. 

Laris C., Jorge “Administración Integral”. Diana, 1969, 

Lázaro, Víctor “Sistemas y Procedimientos”. Diana, 1969. 

Mercado H., Salgado “Administración Aplicada”. UNAM, 1970. 

Reyes P., Agustín “Administración de empresas”, Teorías y prácticas. Limusa, 
1966. 

Reyes P., Agustín “Administración por objetivos”. Limusa. 1971. 

Sánchez G., Francisco “Introducción al estudio de la Administración”. Limusa, 
1976. 

Vélez K., Uriel “Administración”. 2a. parte. ESCA, 1968. 

Vázquez M., Cuauhtémoc “Principios de la Administración por objetivos”. Diana, 
1977. 


A2.42 Auditoría 


Anaya S., Carlos “Auditoría Administrativa, Examen y Evaluación de la 
Empresa”. UNAM, 1968. 

Fernández A., José A. “LaAuditoría Administrativa”. Diana, 1973. 

Ruiz de Velasco, Luis “Auditoría Práctica. Banca y Comercio”, 1973, 


A2.4.3 Administración financiera 


Acosta, Altamirano “Administración Financiera”, ESCA, 1971. 
Del Río G., Cristóbal “Técnica Presupuestal”. UNAM, 1970. 
Reyes Ponce, Agustín “Sueldos y Salarios”. Limusa, 1970. 


A2.4.4 Derecho administrativo 


Fraga, Gabino “Derecho Administrativo”. Porrúa, 1934. 

Olivera T., Jorge “Manual de Derecho Administrativo”. Porrúa, 1963. 

Pérez de León, Enrique Notas de Derecho Constitucional y Administrativo, Vallarta, 
1971. 

Serra R., Andrés “Derecho Administrativo”. Porrúa, 1959. 


A2.4,5 Administración pública 


Busto, Emiliano “La Administración Pública de México”. Fuentes para el 
estudio de la D.P.M. 
Bustani U., José “La Administrición Pública Federal IT”. UNAM, 1973. 
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González A., César 


Mnúoz A., Pedro 
Pinto C., Jorge 


A2.4.6 Organización 


De la Llera, Agustín 


De Lucas O., Ramón 
Miche, Guillermo 
Manero, Antonio 


Montaño, Agustín 
Mayo, Fidel 
Ortiz M., Raúl 


A2,4,7 Relaciones humanas 


Arias G., Fernando 


Arias G., Fernando 
Guzmán V., Isaac 
Guzmán V., Isaac 
Guzmán Y., Isaac 
Guzmán V., Isaac 
Peiró. José Inés 


Pardinas, Felipe 
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“Administración Pública. La Contraloría y sus Funciones”. 
UNAM. 1974. 

“Introducción a la Administración Pública” 

“Administración Pública” (Comraloría). 


“Organización y Funcionamiento de Oficinas”. Banca y 
Comercio, 1948. 

“Organización Científica de las Empresas”. Limusa, 1972, 
“Ecología de la Organización”. Trillas, 1974, 

“Promoción, Organización y Financiamiento de las 
Empresas”. Porrúa, 1958, 

“Iniciación del Método del Camino Crítico”. Porrúa, 1961. 
“Organización y Administración de negocios”. Trillas, 1970. 
“Estructuras Económica y Social de México”. Fondo de 
Cultura Económica, 1971. 


“Técnicas de Investigación en Ciencias de la Administración 
y del Comportamiento”. Trillas, México. 

“Administración de los Recursos Humanos”. Trillas, 1975. 
“LaAdministración de Recursos Humanos”. Limusa, 1974, 
“La Dirección de los Grupos Humanos”. Limusa, 1966. 

“La Sociología de la Empresa”. Limusa, 1967. 

“El Conocimiento de lo Social". Limusa, 1970. 

“El Análisis de Puestos y las Posibilidades que ofrece su 
Aplicación. ITESM. Publicación Trimestral, Vol. XV, No. 
57-1963. 

“Metodología y Técnicas de Investigación en Ciencias 
Sociales”, Siglo XXI editores, 1971. 


A2.4,8 Administración industrial 


Dounce V., Enrique 


A2.4.9 Control 


Gómez M.. Joaquín 


Salas G., Héctor 


A2.44.10 Producción 


AryanaC., Antonio 


Pérez, Marcial 


“La Administración en el Mantenimiento”. CECSA, 1973, 


“El Control interno de los Negocios”. Fondo de Cultura 
Económica. 1954. 
“Control Presupuestal de los Negocios”. Trillas, 1962. 


“Aplicaciones del Control de Producción”. Demasco, 
1967. 
“Cómo mejorar los métodos de Trabajo”, Demasco 1977. 
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A2.5 TIEMPOS EMPLEADOS EN LA CAPTURA DE LA 
INFORMACIÓN (FECHA Y HORA) 


No. de bloque Fecha Hora 
1 13 de marzo 1320 
E 17 de marzo 1820 
3 22 de marzo 10-12 
4 24 de marzo 11-13 
$ 24 de marzo 14-15 
6 25 de marzo 10-12 
7 27 de marzo 18-20 
$ 28 y 29 de marzo 14-18 
9 3 y 4 de abril 1820 
10 5, 6,7, 10 de abril 14-18 
1 11 y 12 de abril 1720 
n 13 y 14 de abril 17-20 
13 17, £3 y 19 de abril 17-21 


A.2.5 PROCESO DE LA CAPTURA DE INFORMACIÓN 


Una vez obtenida esta infor- 
mación se procedió a formar 
el mapa de títulos de libros 
escritos por autores mexica- 
nos sobre administración. 


Dela información por línea 
de trabajo. se busca relación 
que exista entre éstas. 


Se clasificó la información 
de acuerdo con ciertos crite- 
rios que el grupo fijó. 


Consulta al banco de datos 


4 
Recolección de información. 
Detección de que el área Se detectó que existía más 
A de trabajo está muy información de la que se 
limitada esperaba a priori. 
Se buscó nuevamente 
6 Se consultó al profesor información. 
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A2.6 TEXTOS EXPLICATIVOS DEL DIAGRAMA DE LA SECCIÓN 


1. Selección de temas. Los participantes del grupo se reunieron para 
realizar una tormenta de ideas con el fin de detectar los temas posibles 
y agradables por desarrollar y se programó una nueva reunión para 
seleccionar dentro de estas ideas la más idónea. 

2. Definición del tema. Se determinaron los restrictores del tema pro- 
puesto, seleccionando al de autores mexicanos que escriben sobre 
administración. 

3. Localización de las fuentes de información. Se determinó cuáles 
pudieron ser las fuentes de información y se encontró que el banco de 
datos proporcionaría todo lo necesario, además, se pensó en bibliotecas, 
revistas, asociaciones, etcétera. 

4. Consulta al banco de datos. Se visitó el banco de datos Secobi y se 
solicitó la información del tema. 

5, Detección de que el área de trabajo está muy limitada, Se informó que 
en el Banco no se registra por nacionalidad de autores y que si era así, 
los autores mexicanos serían 2 ó 3 como máximo en el Banco de datos 
que se elabora en los EUA. 

6. Consultamos con los profesores. Se planteó el problema a los profe- 
sores y nos aconsejaron que cambiáramos el enunciado por el de obras 
de administración por autores mexicanos. 

7. ¿Continuamos con el tema? Se nos presentó un problema que era el de 
continuar con el tema, cambiarlo o modificarlo, se acordó modificarlo 
por el de obras escritas por autores mexicanos. 

8. Se buscó nuevamente información, Nuevamente se solicitó al banco de 
datos información, pero no se obtuvieron los resultados esperados; se 
consultaron bibliotecas tales como las de la ESCA, y de la Escuela 
Bancaria Comercial, revistas, etcétera. 

9. Se deteció que existía más información de la que se esperaba. En los 
lugares mencionados se encontró información suficiente para realizar el 
mapeo de acuerdo con el campo y área elegidos (títulos de autores me- 
xicanos sobre administración). 

10. Recolección de la información. Se procedió a obtener la información 
que se había localizado en los centros visitados, 

11, Se clasificó la información de acuerdo con ciertos criterios que fijó el 
grupo, De la información capturada, se fijaron restrictores y se procedió 
a clasificarla de acuerdo con las líneas de trabajo que se encontraron. 

12. De la información por líneas de trabajos, se busca su relación entre 
éstas. Después de integrar la información se fijaron criterios para 
encontrar la relación entre las áreas de trabajo. 

13. Una vez obtenida esta información, se procedió a formar el mapa de 
títulos escritos por autores mexicanos sobre administración. 
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Prácticas de escalas de Likert y Guttman 


A3.1 PRÁCTICA DE LA ESCALA DE LIKERT 


Esta escala corresponde al tipo de escala de medición de actitudes y debe 
referirse al nivel de medición ordinal. Se pide la reacción del entrevistado por 
medio de una serio de ítems o juicios, los cuales responden al grado de acuerdo 
o desacuerdo que el sujeto tenga con respecto al juicio citado. A continuación se 
presentan los pasos por desarrollar en la construcción de esta escala. 


Asignación de 
puntajes a 
los ftems 


Construcción 
de los ítems 


Asignación de 
puntajes 
totales 


Análisis de Versión final 
los ftems de la escala 


A3.1.1 Construcción de los Ítems 


Se recomienda que el número de ítems por elaborar sea entre 30 y 50 y se tengan 
en cuenta los criterios que señala Edwards (1967) para la elaboración de éstos.! 


L Edwards, A. L: Techniques of attitude scale construction, Appleton— Century— Crofts; N.Y. 
1967. 


alternativa que más se asemeja a su opinión. 


10. 
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+ Los ítems deben apuntar al presente. 


+ Estos no deben ser ambiguos. 


+ No deben formularse ítems con los cuales nadie concuerda, 
+ Deben formularse en lenguaje simple, claro y directo. 
+ Deben contener sólo una frase lógica; deben ser frases simples y no com- 


puestas. 


+ No deben incluirse términos como “todos”, 


”, “siempre”, “nadie”, etcétera. 


+ Tratar de evitar las negaciones, especialmente las dobles negaciones. 
+ Se deben cambiar los ítems formados en formas positiva y negativa, en un 


50% a 50%, 


A continuación se presenta un estudio de opiniones de usuarios de 
automóviles respecto a los usos que le dan a los mismos. Después se presentará 
una serie de afirmaciones respecto a las cuales algunas personas están de acuer- 
do y otras en desacuerdo. 
Indique por favor (marcando con una X en el paréntesis correspondiente), la 


. El poseer un automóvil grande, da 


imagen de ser gente rica. 


. El poseer un automóvil grande da 


imagen de respeto hacia los demás. 


. El comprar un automóvil grande, 


representa haber triunfado en la 
vida. 


. El objetivo final de muchas per- 


sonas es tener un automóvil grande. 


. El automóvil grande es útil única- 


mente para familias numerosas. 


|. Se sale mejor librado de un acci- 


dente en la ciudad si va en un auto 
grande que en uno chico. 


. En el trabajo y actividades per- 


sonales se es más respetado 
porque se tiene un auto grande. 


. No existe relación entre el auto 


que se tiene y la autoridad que se 
desempeña en el trabajo. 


. El propietario de un auto grande 


de color oscuro da imagen de 
autoridad y poder. 

Quien tiene un auto grande de color 
oscuro trabaja en la Administración 
Pública o es un rico industrial. 


) Muy de acuerdo 

) De acuerdo 

) Ni de acuerdo ni desacuerdo 
) En desacuerdo 

) Muy en desacuerdo 
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25. 


26. 


2. 


28. 


. El comprar un automó 


. Quien tiene un auto grande denota 


que tiene casa propia. 


'. Quien tiene un auto grande denota 


que posee además otro automóvil. 


. Tener un auto grande en la familia 


representa más unión familiar. 


. Debido a la capacidad del auto 


grande para las compras hogareñas, 
quien debe usarlo es la ama de casa, 


. Tener un automóvil chico da imagen 


de ser gente de escasos recursos. 


. Tener un automóvil chico no da 


imagen de respeto hacia los demás. 
chico 
representa muchas limitaciones 
económicas. 


. Tener un automóvil chico represen- 


ta pocas ganas de triunfar en la vida. 


|. El automóvil chico es útil única- 


mente para familias pequeñas. 


). Es más rápido viajar en la ciudad 


en auto chico que en grande. 


. Quien posee un auto chico es un 


estudiante o un asalariado. 


. Los automóviles con interiores cla- 


ros son más fríos que los de inte- 
riores Oscuros. 


. Quien posee un auto chico denota 


que vive en departamento o casa 
rentada, 


. El poseedor de un automóvil chico 


casi siempre tiene otros automó- 
viles más. 

Es más cómodo estacionarse en la 
ciudad en auto chico que en uno 
grande. 

La elección del color del automó- 
vil está dado por la formación inte- 
lectual y social del comprador. 

En general, los automóviles claros 
pertenecen a personas con forma- 
ción en ciencias de la salud y 
químicas. 

Casi siempre los políticos e indus- 
triales de alto nivel prefieren los 
automóviles oscuros que los claros. 
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29. La elección de la marca en la com- 
pra de un automóvil se debe a los 
precios que ofrecen. 

30. Para satisfacer la necesidad de 
transporte es más importante tener 
cualquier automóvil que no tenerlo. 


A3.1,2 Aplicación de ítems a un grupo de jueces 


Los ítems construidos deben aplicarse en una muestra de jueces, entre 50 y 100, 
Estos deben ser seleccionados al azar de una población con características simi- 
lares a la cual se requiere aplicar la escala final. 


A3.1.3 Asignación de puntajes a los ítems 


Ésta puede ser positiva o negativa. En este caso se propone el criterio positivo 
de acuerdo con los siguientes pasos: 


(-) Muy de acuerdo 

(-) De acuerdo 

(- ) Ni de acuerdo ni en desacuerdo 
() En desacuerdo 

( ) Muy en desacuerdo 


ES 


A3.1.4 Asignación de puntajes totales 


En este nivel, se debe adjudicar los puntajes totales de cada individuo en la 
muestra de jueces. El resultado es la suma de los puntajes de cada ítem. 
Las personas con alto grado en la actitud de la variable, van a tener puntajes 
altos. Mientras que las personas con una baja actitud representan puntajes bajos. 
En este ejemplo, el cual contiene 30 ítems y el máximo valor para cada uno 
de ellos es de 4, se tendría como resultado en cada juez un valor máximo de 120. 


A3.1.5 Análisis de los ítems 


Es necesario sumarizar todos los valores de los ítems en cada uno de los jueces y 
los resultados se deben ordenar del más alto al menor. 

En seguida se toman únicamente los valores del cuartel superior y del infe- 
rior. Así se tiene a un grupo con valores y a un grupo con valores bajos. 

En este caso, se aplicaron las preguntas a un grupo de 60 jueces. Los resul- 
tados aparecen en la tabla A3.1. 

Ahora es necesario seleccionar los Ítems que discriminen mejor. Se utiliza 
la técnica del cálculo del poder discriminante de cada ítem, la cual consiste en 
calcular los promedios de cada ítem en cada uno de los grupos, Los resultados 
aparecen en la tabla A3.2. 
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El poder discriminativo de cada ítem, se calculó por medio de la fórmula: 


T  = Testfde Student 

DM= Diferencia entre medias 

Varianzas de muestras | y 2 respectivamente 
N  = Cantidad de casos en cada una de las muestras 


Se relacionan todos los ítems, porque discriminan signifícativamente. 
A3.1.6 Versión final de la escala 


Se toman todos los ítems para aplicarse en definitiva al grupo seleccionado. Al 
final, se sumarizan los puntajes de cada ítem por individuo, y se divide entre el 
total de ftems. 

Si en este caso los jueces números 1, 2, y 47 fueran los individuos encuesta- 
dos, los resultados serían: 


$ 1 105/30 = 3.5 Entre muy de acuerdo y de acuerdo, 
$ 2 104/30 = 3.4 Entre muy de acuerdo y de acuerdo. 
$47 26/30 =0.8 Entre muy en desacuerdo y en desacuerdo. 


A3.2 PRÁCTICA DE ESCALA DE GUTTMAN 


A la escala Guttman, también se le conoce como método del escalograrna o tam- 
bién como análisis de escalograma. 


A3.2.1 Características 


+ La respuesta positiva a un ítem supone que los ítems anteriores han 
recibido aseveraciones positivas (acumulativa). 

+ Posee garantía en las puntas de respuesta, esto ayudado por el coeficiente 
de reproductividad (coherencia). 

+ A través de la gradación puede evaluar lo perfecto o cuasiperfecto de su 
acumulatividad. 


A3.2.2 Proceso en la construcción de la escala Guttman 


2.1 Se construye una serie de Ítems relevantes a la actitud que se requiere 
medir. 
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2.2 Se aplican los ítems a una muestra de jueces. 

2.3 Se ponderan los ítems (puntaje en función a la dirección negativa o 
positiva que se le quiera dar al reactivo). 

2.4 Se procede a realizar el análisis de los ítems. 

2.5 Se llega al diseño final de la escala. 


Para explicar esta metodología, es necesario considerar el siguiente ejemplo: 


. Objetivo: Conocer las actitudes del personal superordinado y subordina- 
do de una empresa respecto al impacto de la organización informal. 

2. Interés: Conocer la importancia que se brinda a la organización informal 

en: 


+ Repercusiones en la organización formal (diagrama de organización). 

+ Evasiones a la cadena de mando. 

Liderazgos técnicos (en coincidencia) que actúan como líderes infor- 
males. 

+ Estilo de liderazgo que propicia el crecimiento de grupos informales. 
Impacto del desarrollo externo del que se emplea como imagen de los 
grupos informales. 


» 


3. Cuestionario: 


a) La anterioridad informal debe incluirse en el organigrama. 
( ) De acuerdo. ( ) En desacuerdo. 

b) El subordinado de tercer nivel, puede acordar con el de primer nivel. 
( ) De acuerdo. €) En desacuerdo. 

c) La autoridad formal debe coincidir con la autoridad técnica. 
(- ) De acuerdo. € ) En desacuerdo, 


d) El subordinado obedece, pero es más importante que le sugiera al supe- 
rior cómo dirigir. 


€) De acuerdo, (- ) En desacuerdo. 


£) No es importante para un superior el conocer la organización de su per- 
sonal fuera del trabajo. 


€) De acuerdo. € )En desacuerdo. 
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4. Procedimiento. 
4.1 Se procede a totalizar el puntaje de cada uno de los jueces por cada uno 
de los ítems. 


4.2 Se ordena a losjueces según el puntaje total, en el sentido de: 


Puntaje más alto. 


Puntaje más bajo. 


4.3 Se diseña un gráfico (cuadro), llamado análisis de escalograma (en este 
caso) de 10 jueces para $ ítems, en orden a: 


(-x ) acuerdo y 
(o ) desacuerdo 


1 AO 


Rango del 

de 
[sx] 
bos xx] 


4,4 Interpretación: 
No. de preguntas =3 
No. de jueces =10 
Cantidad de respuestas (total = 50 = 5 X 10). 


Cantidad de errores = 6 


474 PRÁCTICAS DE ESCALAS DE LIKERT Y GUTTMAN 


dE Cantidad de errores 
( Cantidad total de respuestas 


Reproductividad = R = )j=1= 


Como el valor es cercano a la unidad, se aceptan los valores de los jueces en 
la escala. 


APÉNDICE 
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476 TABLAS 
Tabla A4.1 Números aleatorios 

544269 532401 60922 906124 231992 78695 623795 289005 
309951 348063 884974 TIZIG2  82%64 248783 882486 940545 
TAIGIT 354964 BTAGOD 409724 227122 234736 202674 345153 
984066 207980 314398 486395 843213897509 44I5IS 538274 
TÓBSIB 824676 342500 392788 583927 54425 7I2902 747178 
B2S221 494554 972] 62832 556244 79358 773201 187843 
69219 358383 346338 POISZ S4744] 346395 364456 410239 
878366 TINZG 59013 825030 290001 35670 492028 507827 
52397 620604 487466 837708 369235 731937 673493 397400 
99638 606368 223000 956004 568979 990479 986335 334795 
39B5II 284316 487550 247011 510284 337911 261399 326608 
299279 97454 T1A3L S391OO 653394 593075 81l869 095635 
333027 174400 131064 TETISL 730373 371558 6090951 443515 
148367 590510 701473 657241 245303 3029138 653330 515822 
424559 556666 894268 960773 7I282]1 378597 75285 303073 
TAO982 683560 601299 196410 57892 983946 191892 177097 
44138 651990 991617 117199 751048 859743 711990 583) 19 
490622 887649 719335 868086. 923067 996017 70918 904086 
936366 862174 57266 TAB9S1 626689 767304 75055 439374 
S60345 714915 80072 264946 943662 138948 295062 105353 
659398 496882 75305 638025 295239 BDIAD 909595 568636 
73148 399432 243044 644674 30748 773902 937509 772081 
368234 910800 820814 434459 957595 31OG7D 433417 432821 
421611 18379 892018 154667 4B4190 TISS69  9%lla 680496 
ISITS] 678207 626757 92597 96602 547412 348482 930374 
799640 556974 59492 875578 846547 963 198330 32998 
105658 782805 605284 9795 608487 342935 208123 91886 
493699 596486 148673 7AMB9 261986 199135 852905 77505 
28445 STALBO 405233 TAI93L 635775 470999 78454 569036 
797110 3TBL3SILTGS 236315 740632 807162 99173 962660 
440937 834804 562674 855190 186986 662853 569472 116304 
45T46 852476 381039 128293 219258 STA S6TOLL 760379 
69385 322040 S26932 14TTOS 466046 837104 2074%0 278586 
189523 314210 921973 655034 211039 934434 39813 126133 
587010 804 SU73ZT 648574 579838 337783 123102 966744 
19965 964360 5127 167089 264486 211727 485756 106685 
as 791472 272095 994229 10283] 279835 188682 168173 
ATASIA 154902 435990 677088 813871 735138 474006  SIS906 
53001 719544 797987 TIOIBO 586477 916788 4SSTIA 191031 
6SÓT2I 5IIOOD 989646 992669 T9GÍ28 248M7 968684 675548 
937468 30323 41180 98317408272 832195 712951 568102 
86896 468010 TOLBEY 645899 623216 393242 251083 0%6443 
876459 658295 968436 SITAS 885258 544218  GTTI3S 611433 
356515 945574 274991 763863 253346 973691 336332 645306 
665734 1926 355259 842247 6SM67 104490 150272  6l6811 
747409 707405 3GT4AT 680667 YTIG21 883922 SOLES 737583 
563133 579073 487793 333354 677918 766761 961529 42044) 
364440 147695 3LIT26 174998 181687 615284 85136 876973 
296236 830597 344508 6S9012 145849 274308 61325 30793 
350808 20162 856282 544947 93299 971505 91521 180018 


ÁREA BAJO LA CURVA NORMAL 


Tabla A4.2 Área bajo curva normal. 


Z 00 01 02 03.04 .05 06 .07 08 09 
0 500 504.508 512 516 500 52% .528 .532 .536 
1 540.544 .588 .552 556 560 564 .567 571.575 
2 519 583 587 591 595 599 .603 .606 610 6la 
3.618 622 .6l6 629 .633 .637 641 .5tk .638 .652 
4 655 .659 663 666 .6H) .674 677 .68l 684 .688 
5 691 .695 .698 .102 108 109 112 6 719 122 
6 76 M9 1 76 719 142 745 299 152 755 
3158 161 364 167 TO 173 116 119 182 185 
8.788 791 794 797 800 802 805 .808 Sl 813 
9 316 819 321 .824 .826 829 .831 .834 836 .839 
10 34] 844 346 848 851.853 .855 .858 .860 862 
1.1 864 867 869 871 873 875 .877 .879 881 883 
12 .885 887 .889 891 .893 894 .89% .898 900 901 
13 .903 505 907 908 910 91IL 913 915 916 918 
14 919 91 92 924 95 926 98 99 931 932 
15 933 934 936 .937 908 939 .941 942 943 944 
16 945 M6 M7 948 949 951 .952 953 954 954 
17.955 956 .957 .958 .959 950 .96l 962 962 963 
18 964 965 965 966 .967 968 969 99 970 91 
19 3 972 973 973 97% 97% 976 90 916 977 
20 97 978 978 979 979 980 .980 981 .981 982 
2.1 982 983 983 983 “984 984 .985 .985 .985 .986 
22 986 986 .987 .987 988.988 .988 .988 .988 989 
23 .989 990 .990 990 .990 990 99 .991 991 992 
24 992 992 9% .992 993 993 .993 .993 .993 994 
25 294 994 994 994 994 995 995 995 995 .995 
26 995 995 96 996 906 906 .996 9906 996 996 
2.7 997 997.997 997 997 997 .997 .997 977 997 
2.8 997 998 998 998 .998 998 998 .998 998 .98 
29 998 998 998 998 .98 98 998 909 99 .999 
30 999 999 99 999 .99 99 99.999 .999 .999 
841 
1.00 z 
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025 


- 2.056 


Tabla A4.3 Valor crítico de Tes- 
tudiante, Área bajo la curva distribu- 


ción T 

10.05 025 01 
1 6314 12.706 31821 63,657 
2 290 4303 6965 995 
3 2353 3,182 4541 5.84] 
4 2132 2776 3347 460 
5 2015 2571 3365 4.032 
6 1943 2447 3.143 3.707 
7 1895 2.365 2998 3499 
8 1860 23406 2896 3.355 
9 1833 2262 2821 3250 
10 1312 2228 2764 3.169 
11 1796 2201 2.718 3.106 
12 1782 2479 2681 3.055 
13 1771 2160 2650 3.012 
14 176L 2.145 2624 2977 
15 21753 2131 2.602 2947 
16 7.146 2.120 2583 2921 
17 1749 2.410 2567 2898 
18 1734 2,101 2552 2818 
19 1.729 2093 2539 2861 
20 1.725 2.086 2.528 2845 
21 1721 2080 2518 2831 
22 1717 2074 2508 2819 
23 1714 2069 2500 2807 
24 1711 2064 2492 2.797 
25 1,708 2060 2485 2.787 
26 1706 2056 2479 2779 
27 1.03 2052 2473 2.11 
28 1701 2048 2467 2763 
29 1699 2045 2462 2756 
1645 1960 2326 2.576 

.025 

+2.056 


TABLAS 


as) 


VALOR CRÍTICO DE J7 CUADRADA 


Tabla A4,4 Valor crítico de JI cuadrada 


Grado 
de ÁREA DE LA DISTRIBUCIÓN JI CUADRADA 
libertad 
99 95 95 os ms nu) 
1 0002 0010. 0039 3.842. 5.024 6.637 1 
2 0201 0507 1026 5995 7.379 9.221 2 
3 1148 2158 3518 7.817 9.354 11.325 3 
4 29 4844 2107 949 11.150 13.280 4 
5 5542 332 1.1455 11.073 12.838 15.088 3 
6 8320 12372 1.6353 12.596 14.459 16.310 6 
7 1.2387 1.6898 2.1673 14.070 16.020 18.471 7 
3 1.6463 2.1796 2.1325 15.512 17.546 20.082 3 
9 2.0875 2.7003 3.3251 16.925 19.031 21.654 9 
10 2.5580 3.2463. 3.9402 18.311 20495 23.194 10 
u 3.0530 3.8154 4.5147 19.681 21.829 24.755 3” 
n 3.5703 4.4036 5.2258 21.030 23.349 26.246 n 
13 4.1064 5.0085 5.8918 2.367 24.745 27 13 
14 4,6596 5.6283 6.5705 23.691 26.132 29.169 1” 
15 5.2239 6.2619 12607 25.000. 27.498 30.605 15 
16 5.8115 6.9073 79615 26.301 28.858 32.027 16 
17 6.4073 7.5637 8.6716 27.593 30201 33.435 ” 
18 7.0142 8.2305 9.3902 28,817 31.538 34.831 18 
19 7.6317 8.9062 10.1167 20.143 32.867 36.216 19 
2 8.3598 9.5903 10.8507 31.416 34.181 37.591 2 
21 8.8963 — 10.2826 11.5911 32.678 35493 38.957 21 
2 9.5412 10.9819 12.3378 33.933 36.192 40314 2 
2 10.1949 11.680 13.0902 35.178 38.089 41.662 23 
24 10.8552  12.4005 13.8480. 36.421 39.380 43.004 24 
25 11525 13.119 146112 37.660 40.659 44.337 25 
26 12.1972 138434 15.3789 38.894 41.938 45.665 26 
vi) 12.879 14.5727 16.1511 40.119 43.206 46.986 27 
23 13.5638 — 15.3070 16.9275 41344 44.475 43.301 28 
29 14,2553 — 16.0466 17.7079 42.565 45.738 49.640 2 
0 119519 — 16.7902 13.4924 43.782 46.992 50.914 EJ 
40 22.1394 244229  26.5080 55.753 s9.M5 63.710 40 
50 29.6845 323485  34.7634 67.501 71423 76.172 50 
60 37.4647 404739 431874 79.078 83.301 38.396 60 
70 45.4231  48.7504 517389 90.528 95.026 100.444 7 
80 53.5227  57.1466  60.3912 101.876 106.631 112.344 80 
9 61.7377  65.6405  69.1259 113.143 118.139 124.130 20 
100 0.0494 742162 77.92% 124.340 129.564 135 820 100 
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o 1 F (gln, gld, 0.025) 


Las entradas de esta tabla son valores críticos de F, para los cuales el área bajo la 
curva a la derecha es igual a 0.05. 


Tabla A4.5 Valores críticos de la Distribución F (a = 0.05) 


GRADOS DE 'LIRERTAD DEL NUMERADOR 


£ 2 3 4 s 6 7 3 9. 1 
1 161 200 216 225 230 234 237 239 Ml 242 
2 185 190 192 192 193 193 194 194 194 194 
3 10] 955 928 912 901 89% 889 885 881 879 
4 TIL 694 659 639 626 616 609 604 600 556 
s 661 579 54 519 505 495 488 3482 477 474 
6 599 5.14 476 453 439 428 421 415 410 406 
e 7 559 474 435 412 397 387 379 373 468 364 
3 8 532 446 407 384 369 358 350 344 339 335 
Z 9 SI2 426 386 363 348 337 32% 323 318 314 
E 10 396 410 371 348 333 322 314 307 302 298 
E a 484 398 359 336 320 309 301 29 2% 285 
SS L 475 339 349 326 3.11 300 29 285 280 275 
la] 13 467 381 341 318 30% 2% 283 217 21 26 
S l4 460 374 334 311 296 285 276 270 265 260 
Q 15 454 368 329 306 290 279 271 264 259 254 
S 
ES 16 449 363 324 301 285 274 266 259 254 249 
3 Y 445 359 320 2.96 281 270 26l 255 249 245 
E 18 441 355 3.16 293 277 266 258 251 246 241 
E 19 438 352 313 29 274 263 254 248 242 238 
2 20 435 349 310 287 271 260 251 245 239 236 
E 2 432 347 307 234 268 257 249 242 237 232 
2 430 344 305 282 266 255 246 240 234 230 
2 428 342 303 230 264 253 24 237 232 227 
24 426 34 301 278 262 251 242 236 230 225 
25 424 339 299 276 260 249 240 234 228 22% 
30 4.17 332 292 269 253 242 233 227 22 216 
40 408 323 284 26] 245 234 225 218 212 208 
60 400 3.15 276 253 237 225 217 210 204 199 
mo 392 307 268 245 229 218 209 202 19 191 
co 334 300 260 237 221 210 201 19 188 133 


VALORES CRÍTICOS DE LA DISTRIBUCIÓN F (0 = 0.05) 


Tabla A4.5 Distribución F. (Continuación) 


GRADOS DE LIBERTAD DEL NUMERADOR 


1215 20 24 30 40 60 120 ES 


1 244 246 248 249 250 251 252 253 15 
2 194 194 194 195 195 19.5 195 195 195 

3 5.74 8.70 866 864 862 859 357 855 $53 
4 591 586 580 577 575 572 569 5866 563 
5 468 462 456 453 450 446 443 440 437 


% 6 400 394 387 384 38l 377 374 370 36 
3 1 357 351 344 341 338 324 330 327 32% 
3 3 38 32 3,15 Ei 3.08 3 3.01 LN 2.93 
5 g 307 3.01 294 290 286 283 E 2.75 2n 
S 10 291 285 277 2714 24 2 266 258 254 
15] 
a n 279 272 265 261 257 249 245 240 
1 12 269 262 254 251 247 2.38 2.34 2% 
E 13 260 253 246 242 238 230 225 22 
Q 1 253 246 239 235 231 22 2.18 PRE 
E 15 248 240 233 229 225 2.16 211 207 
S 16 242 235 228 224 219 215 211 206 201 
ES y 238 231 238 21 25- 210 2.06 201 1.96 
pS 18 24 227 2.19 2.15 21 206 202 197 19 
3 19 24 73% 216 21 207 203 1.98 193 1.38 
Z 2 228 220 212 208 204 19% 195 19% 184 
S 
21 225 218 210 205 2.01 1.96 1392. 1387 131 
2 23 215 207 2.03 198 194 1.89 1.84 178 
3 2% 213 205 201 196 191 186 181 1,76 
24 218 211 203 198 194 189 184 179 173 
25 216 209 201 196 1.92 1.87 182 in 1 
30 209 201 193 189 1.34 179 174 1.68 162 
40 200 192 184 179 1.74 1.69 1.64 1.58 151 
60 1.92 134 175 170 165 1,59 1,53 147 139 
10 183 175 166 16l 155 150 143 135 125 


. LIS 167 157 152 146 139 132 122 100 
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F Gl, gld, 0.05) 


TABLAS 


Las entradas de esta tabla son valores críticos de F, para los cuales el área bajo 


la curva a la derecha es igual a 0.025. 


Tabla 44.6 Valores críticos de la distribución F (a = 0.025). 


GRADOS DE LIBERTAD DEL NUMERADOR 


1 2 3 4 
1 648 300 364 900 
2 38.5 390 392 39.3 
3 174 160 154 15.1 
4 122 106 99% 960 
5 100 843 776 739 
ES 6 881 716 660 623 
S 7 807 654 589 552 
E 3 757 606 542 505 
S 9 721 57 508 472 
E 10 694 546 233 447 
2 n 672 526 463 42 
3 1 655 5.10 447 412 
ES 13 641 497 435 400 
E 14 630 486 424 3.39 
5 45 620 477 4.15 3.30 
ES 
3 16 612 40 408 373 
A Y” 604 462 401 266 
8 18 598 456 3.95 3.61 
[1 19 592 451 3.90 356 
E 20 587 446 386 3.51 
$ 
2 583 442 382 348 
2 579 438 378 344 
23 575 435 375 341 
24 52 432 372 3.38 
25 569 429 369 3.35 
30 357 4.8 359 325 
40 542 405 346 3.13 
60 529 393 334 3.01 
120 5.15 3380 323 2.89 
» $502 369 312 2.79 


5 


sn 


39.3 

149 
9.36 
715 


599 
529 
4.82 
448 
424 


4.04 
3.59 
37 
3.66 
3.58 


3.50 
3.44 
3.38 
333 
3.29 


325 
3.22 
3.18 
3.15 
3.13 


3.03 
2.90 
2.79 
2.67 
2.57 


6 


97 
39.4 
147 

9.20 
698 


5.82 
5.12 
4.65 
432 
4.07 


3.88 
373 
3.60 
3.50 
3.41 
3,34 
3.28 
3.2 
2.17 
3.13 


309 
3:05 
3.02 
2.99 
297 


2.87 
2.74 
2.63 
2.52 
2.41 


7 


938 
2394 
146 

9.07 
635 


5.70 
499 
4.53 
4.20 
395 


376 
3.61 
3.43 
3.38 
3.29 


32 
3.16 
3.10 
3.05 
3.01 


297 
293 
2.90 
2.87 
2.85 


2.75 
2.62 
251 
2.39 
2.29 


957 
39.4 
145 

3.98 
6.76 


5.60 
490 
443 
4.10 
3.85 


3.56 
351 
339 
3.28 
320 


3.12 
306 
301 
2.96 
291 


2.87 
2.84 
281 
28 
2.75 


265 
2.53 
2.41 
2.30 
2.19 


963 
294 
145 

3.90 

6.68 


5,52 
482 
436 
4.03 
3.78 


3.59 
34 
331 
321 
3.12 


3.05 
293 
2.93 
2.83 
2.84 


2.80 
2.76 
2.73 
2.10 
2.68 


2.57 
2.45 
23 
222 
211 


10 


969 
394 
144 
8.84 
6.62 


546 
4.76 
4.0 
396 
3.72 


3.53 
337 
325 
3.15 
3.06 


299 
292 
2.87 
2.82 
20 


2.3 
2.70 
2.67 
2.64 
261 


2.51 
2.39 
227 
2.16 
2.05 
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Tabla A4.6 Distribución F (continuación). 
GRADOS DE LIBERTAD DEL NUMERADOR 
hn. 15. 2 2 2» 2% 60 ms 
1 977985 93 97 1001 1006 1010 1014 1.018 
2 394 394 394 395 3I905 393 395 395 395 
3 143 143 142 141 14] 140 140 139 139 
4 875 866 856 851 846 841 836 831 826 
5 652 643 633 628 623 618 612 607 602 
9 
8 6 537 527 SIT 512 507 501 49 490 485 
ES 7 467 457 4AT 442 436 431 425 420 414 
ES 8 420 4.10 400 395 389 384 378 373 367 
3 9 387 317 367 361 356 351 345 339 333 
á 10 362 352 342 337 331 326 320 314 308 
3] 
E " 343 333 3232 317 312 306 2.88 
A 2 328 318 307 302 2% 291 272 
E 13 FIS 3058 295 289 284 278 2.60 
8 14 305 295 284 219 213 26 2.49 
15 296 2386 216 210 264 25 2.40 
3 
ta 16 289 279 268 263 257 25 245 238 
a D 282 2% 262 256 230 24 238 232 
18 2.77 267 236 250 244 238 232 226 
19 2.72 262 252 245 239 233 22 22 
$ 20 268 257 246 24] 235 229 22 216 
2 264 253 .242 237 231 225 218 211 204 
2 260 250 239 233 227 221 21M 208 200 
2 257 247 236 230 224 218 211 204 197 
24 254 244 233 227 221 215 208 20 19 
25 251 241 230 224 218 212 205 19 191 
30 241 231 220 214 207 201 19 187 179 
40 229 218 207 201 194 188 180 172 164 
60 217 206 J94 188 182 174 167 158 149 
120 205 195 182 176 169 161 153 143 131 
“o 194 183 17 164 157 148 139 127 100 
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0 1 Fígln, gdd, 0.01) 


Las entradas de esta tabla son valores críticos de F, para los cuales el área bajo 
la curva a la derecha es igual a 0.01. 


Tabla A4,7 Valores críticos de la distribución F(a: =0.0 D. 


GRADOS DE LIBERTAD DEL NUMERADOR 
A 80 9.010 
1 4,052 5,000 5,403 5,625 5,764 5,859 5,928 5.982 6.023 6,056 
2 985 990 92 93 93 94 94 994 94 9%4 
3 341 308 295 287 282 29 27 215 23 212 
4 21.2 13.0 16.7 160 155 152 150 148 14,7 145 
Ss 163 133 ul 114 110 10.7 105 103 102 10.1 
ES 6 137 109 978 915 875 847 826 810 798 787 
3 7 122 95 845 785 746 719 699% 684 672 662 
É 8 113 865 759 TO 663 637 648 $03 59 581 
S 9 10.6 802 699 642 606 580 5:61 547 535 526 
2 10 10.0 7,56 655 599 564 539 520 5.06 494 485 
pS] 
a mí 9.65 72 622 567 532 507 489 474 463 454 
a 1 933 693 595 541 506 482 464 450 439 430 
a 13 9.07 6.70 574 521 486 462 444 430 419 4.10 
Z 14 8.36 6.51 5.56 504 470 446 428 414 403 3394 
El 15 368 636 542 489 456 432 414 400 389 380 
ÉS 
2 16 853 623 529 417 444 420 403 389 318 369 
a Y” 8.40 6.11 5.19 467 434 410 3593 379 3.68 359 
S 18 3829 6.01 509 458 425 401. 3.84 3 360 3.51 
3 19 819 593 501 450 4.17 394 377 363 352 343 
z 20 310 585 494 443 4.10 387 2370 356 346 337 
$ 
2 3.02 487. 437 381 364 351 340 
2 795 482 431 376 359 3.45 335 
3 738 476 426 3M 354 341 330 
24 7132 472 42 367 350 336 326 
25 17 5.57 468 4,18 363 3,46 33 322 
30 7.56 539 451 402 370 3.47 350 3.17 3.07 2.98 
40 731 5.18 4.31 3,83 351 329 3.12 299 289 280 
$0 708 498 413 365 334 312 295 28 272 163 
no 685 4.79 395 48 317 296 279 2.66 256 147 
o 6.63 461 378 332 3.02 280 2.64 2.51 241 232 


VALORES CRÍTICOS DE LA DISTRIBUCIÓN Fa = 0.01) 485 
Tabla A4.7 Distribución F (continuación) 
GRADOS DE LIBERTAD DEL NUMERADOR 
13 is 20 2 30 40 60 120 > 
1 | 6.106 6157 620% 6235 6261 6287 6313 6339 6366 
2 94 94 94 995 995 95 95 95 95 
3 DI 269 267 266 265 264 263 262 261 
4 M4 142 14.0 09 138 137 137 136 135 
5 9.89 272 955 9.47 9.38 9.29 920 9.11 902 
% 
S 6 IT TS6 74D 731 723 TIM 706 697 688 
z 7 647 631 616 607 59 59 582 57M 565 
é 3 S6T 552 536 528 52M 512 503 49% 486 
3 E ES 496 431 473 465 45, 4.48 4.40 431 
$ 
á 10 47 456 441 433 425 417 408 400 3391 
a 
3 ” 440 425 410 402 394 386 378 369 360 
a n 416 401 386 378 370 362 354 345 336 
Q B 3.96 3.82 3.66 359 351 3.43 334 3.25 317 
5 14 380 366 351 243 335 327 318 309 300 
E 15 367 352 337 329 32 313 308 29% 287 
3 
E 16 3.55 341 3.26 3.18 310 3.02 2.93 2.84 2.75 
ÉS Y 346 331 316 308 300 292 283 275 265 
$ 18 337323 308 300 292 284 275 266 257 
E 19 1303.15 300 292 284 27 267 258 249 
$ 20 323 309) 294 286 278 26% 261 252 24 
a 3,17 303 2.38 2.80 232 2.64 2.55 2.46 2,36 
2 3.12 298 283 275 261 258 250 240 231 
3 307 293 278 270 262 254 245 235 22% 
24 303 289 274 266 258 249 24% 231 22 
25 299 285 2 262 253 245 236 227 217 
30 234 27 255 247 239 230 221 211 2.01 
40 266 252 237 229 220 211 202 19% 180 
60 250 235 220 212 203 194 184 173 160 
120 234 219 203 195 186 176 166 153 138 
a 2.18 204 188 179 170 159 147 132 100 
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Tabla 44.8 Valor crítico de Ten la prueba de Wilcoxon. 


Nivel de significancia para una sola cola 


N 0.025 | 01 | .00S 

Nivel de significancia para prueba de dos colas 
0s | 02| 01 
6 0 = = 
7 Es 0 — 
3 4 2 0 
3 6 3 2 
10 3 5 3 
1 .u 7 5 
y la lo ES 
B 17 13 19 
14 21 16 3 
15 25 20 16 
16 30 a 20 
1? 35 28 23 
18 30 3 28 
19 46 38 nm 
py] 5 43 38 
pa] s9 49 43 
2 66 56 49 
3 3 62 55 
a 8L 69 61 
25 89 n 63 
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Análisis de datos mediante cómputo 


A5.1 INTRODUCCIÓN 


En este apéndice se indica a los alumnos cómo preparar y realizar el análisis de 
datos mediante cómputo, usando uno de los paquetes estadísticos más conocidos 
y más accesibles, el Paquete Estadístico para las Ciencias Sociales (Statistical 
Package for the Social Sciences). Todos los posibles análisis estadísticos 
descritos en esta obra se pueden realizar mediante subprogramas de SPSS.! 

Una de las particularidades de este paquete es la facilidad para manejar 
diferentes análisis de datos como: registrar variables, tratar con valores no con- 
testados (missing values), es decir, el paquete contiene ciertos procesos para 
todos los casos del estudio. Con este paquete se puede tomar un muestreo, medir 
pesos de cada variable, seleccionar casos, computar nuevas variables y efectuar 
transformaciones permanentes o temporales. 

En este apéndice se explica cómo usar este paquete, para más detalles con- 
sultar el manual de este paquete. 


A5.2 PREPARACIÓN DE DATOS 


La primera etapa para usar este paquete es perforar los datos en tarjetas termi- 
nales de cómputo. Ya se explicó en este capítulo el proceso de elaboración de 


*A los lectores que no tienen conocimientos de estadística, se sugiere leer los capítulos 11, 12, 13 en 
perfección y, después leer este apéndice. 

1 Nie, H. Norman Hull, C. Hadali, Jenkins Jean G., Steinbrenner Karin y Brent Dale, Statistical 
package for the social sciences, ?a. edición, McGraw-Hill, Nueva York, 1975. 
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datos y sabemos que para cada caso se debe de tener tarjeta(s) separadas. Para el 
acceso al SPSS se necesitan otras tarjetas adicionales llamadas tarjetas de con- 
tro! (JOB CONTROL, LENGUAJE CARDS). Estas tarjetas de control no son 
estándar, porque cada centro de cómputo tiene su propio tipo de control. 


A5.3 CREAR ARCHIVOS 


En lenguaje SPSS es muy simple, hay una consistencia entre el lenguaje y el 
patrón empleado que ajusta sus expectaciones. Se puede llamar a realizar cier- 
tos trabajos (control), y anunciar al sistema cómo se desea llevar a cabo el tra- 
bajo (especificación). Las primeras quince columnas están designadas para 
mandar (archivo de control), mientras que de las columnas 16 a 80 (archivo de 
especificaciones) permiten determinar cómo se quiere que se realice el análisis 
O se realice la transformación. Si las especificaciones requieren más de 64 
columnas entre 16 y 80, se puede continuar en la siguiente línea (tarjeta) sin 
separar palabras o aspectos lógicos, recordando que la computadora no puede 
leer español ni inglés para interpretar las necesidades, solamente reacciona a 
signos (caracteres) para los cuales ha sido programada. 

La primera etapa sería construir un archivo para almacenar no sólo los 
datos, sino también la información relacionada con tipo, contenido, ubicación, 
nombre, etcétera, de los datos. En la tabla AS.1 hay una lista de los formatos de 
control (CONTROL CARD) en el orden que deben incluirse en el programa. 


A5.3.1 Explicaciones de la tabla A5.1 


1. RUN NAME. Es un formato de control que permite etiquetar el proceso 
del análisis. Este nombre aparece arriba de cada página de la salida de la 
computadora. 

2. FILE NAME. Es un formato de control para nombrar o etiquetar el 
archivo de su trabajo. En cada proceso de aplicación de SPSS se debe de 
acudir al archivo usando GET FILE, el archivo estará presente en todas 
las operaciones. 

3. VARIABLE NAME. Las variables se deben de nombrar en el orden 
especificado anteriormente, por ejemplo VI para la variable uno y YN 
para la última variable. 

4. N OF CASES. Es un formato de control que especifica el número de 
casos que se había registrado en el archivo. El número de casos se. 
refiere al número de personas que han sido entrevistadas, el número de 
sujetos que han sido observados o el número de cuentas que se hayan 
investigado. Si uno está presentando sus datos a la computadora me- 
diante cinta o disco se puede anotar la palabra UNKNOWN en lugar del 
número de casos, pero si se han utilizado tarjetas para presentar datos a 
la computadora se debe de especificar el número de casos. 


CREAR ARCHIVOS 


Tabla A5.1 Especificación de formato de SPSS, 


Campo de control Campo de especificación 
(Empieza en la columna 1) (Empieza en la columna 16) 

Nombre de proceso de análisis Título del proceso de análisis 
(RUN NAME) Hasta 64 caracteres 
“Nombre de Archivo El nombre debe tener máximo 8 
(FILE NAME) letras alfabéticas 
[GET FILE] [FILE NAME] 
Registrar cada variable Nombre de variable no más de 8 
(VARIABLE LIST) letras (VARIABLE NAME) 
Número de casos Hay que especificar el número 
(NOF CASES) de casos o UNKNOWN 
INPUT MEDIUM DISK O CARD O TAPE 
INPUT FORMAT FIXED 

*VAR LABELS 'VARNAME Nombre de la variable 
*VALUE LABELS VARNAME Valores de cada variable 
MISSING VALUES Nombre y valor de la variable 
READ INPUT DATA No especificación 
PRIMEROS Procedimientos Insertar aquí 
SAVE FILE (Guardar el archivo) No especificación 
FINISH (Final del proceso) 

*Opcional. 


5. INPUT MEDIUM. Este formato de control indica al sistema los datos 


que se deben leer. Uno debe de enunciar el dispositivo mediante el cual 
sus datos han sido almacenados. (Tarjetas, disco o cintas). 

. INPUT FORMAT. Este formato de control especifica la organización 
de los casos del estudio, el nombre y ubicación de las variables. ** 

. VAR LABELS. Aquí se debe de describir más específicamente cada 
variable. Por ejemplo VII —Ha Comprado Quinielas de Pronósticos 
Deportivos. 

VALUE LABELS. En esta parte se deben de especificar los valores u 
opciones de cada variable. Por ejemplo, si la variable 11 está codifica= 
da de 1 hasta 3. ( 1. Sí pero dejé de comprar, 2. Sí sigo comprando, 3. 
No.) Cuando se usa la variable para ciertos análisis los valores de las 


+*En este apéndice se explica el procedimiento de formato de presentación de datos. 
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opciones se imprimen en hojas de computadora, igual que las explica- 
ciones de cada opción aparecerán enfrente de cada código 

9. MISSING VALUES. Es un formato de control para definir cuáles va- 
lores de la variable no han sido contestados. La habilidad del MISS- 
ING VALUES es tal que permite al investigador incluir o excluir en 
sus análisis las variables que contienen valores no respondidas. 

10. READ INPUT DATA. Este formato cambiará el control del programa 
al sistema. Advierte al sistema que los datos se deben leer del archivo. 
Si se está trabajando con tarjetas, éstas se deben de presentar al lector 
óptico, 

11. SAVE FILE. Este formato de control guarda los datos con todas las 
especificaciones y modificaciones en un archivo permanente dentro de 
la memoria de la computadora. Se abre un archivo porque se supone 
que la información guardada en él será utilizada para los análisis poste- 
riores. Guardar la información en el archivo ahorra mucho tiempo y 
trabajo, porque ya no se necesita escribir los datos en la computadora, 
perforar las identificaciones de las variables, escribir el formato, 
etcétera, 

12, FINISH. Este formato especifica que se han cumplido con todas las 
reglas de SPSS. Este formato transfiere el control otra vez al sistema, 


A5,4 FORMATO DE INSUMO DE DATOS 


La tarjeta de alimentación de datos contiene la palabra INPUT FORMAT en el 
archivo de control, precedido con la especificación de la palabra FIXED y la 
lista de formatos. La palabra FIXED significa que las variables no cambian su 
lugar dentro de las tarjetas; por ejemplo, la columna 16 pertenece a la variable 
11 y siempre será así. La lista de formatos contiene elementos en la forma 
nFW.d que es un formato de estilo FORTRAN, en donde: 


n= Número de variables consecutivas con el mismo formato. 

F Formato fijo. 

W  = La extensión del archivo en columnas, tomando en cuenta el signo 
+ —) del valor y punto decimal, en caso que se hayan perforado las 
tarjetas así. 

d  = Número de dígitos que implica el decimal. 


Los siguientes símbolos se usan para la localización de las variables. 
ax  = Saltar “n” colurana 

Tr  = Tabular o transformar en la columna “n” 

f = Saltar a siguiente registro 


MODIFICACIÓN Y PROCEDIMIENTO 491 


Ejemplo: 
t 16 
INPUT FORMAT FIXED (1X, 16F1.0, F2.0 
2F1.0, F4.0 ----- 4F1.0+ 


Este formato indica que en la primera columna no hay nada; 16 variables 
usan una sola columna, una variable usa 2 columnas, después 2 variables usan 
una columna y una variable usa 4 columnas y así hasta el final. Las últimas cua- 
tro variables usan una sola columna o espacio. 


A5,5 MODIFICACIÓN Y PROCEDIMIENTO 


Cuando se especifican todos los formatos de control y los formatos de la defini- 
ción de datos, se está listo para tomar puntos finales de la construcción del archi- 
vo dando instrucciones de “DO” a la computadora para realizar algo con los 
datos almacenados. Dos procesos importantes a que se dedica este apéndice son: 
explicar la modificación de datos (DATA MODIFICATIONS) y el procedimien- 
to del análisis estadístico (PROCEDURES). 

Por lo general, para manipular o transformar los datos en cualquier forma se 
usa (DATA MODIFICATIONS). 

Para los análisis estadísticos o computar algur:os valores estadísticos se usan 
PROCEDURES. En este apéndice se usa RECODE, COMPUTE, SELECT IF y 
MISSING para la modificación de datos y los procedimientos estadísticos que se 
explican aquí son: FREQUENCIES, CONDESCRIPTIVE, CROSS TABS, DIS- 
CRIMINANT, FACTOR GUTMAN and SCATTERGRAM. 


AS.5,1 La primera salida de cómputo (listado) 


La primera salida de cómputo debe de ser utilizada para satisfacer los objetivos. 
Primero, es necesario determinar que los datos han sido traducidos en SPSS 
exactamente como hemos planeado. Segundo, se debe verificar para corregir po- 
sibles errores de perforación. SPSS siempre en sus salidas imprime INPUT 
FORMAT, que incluye la lista de variables, por nombre, cohimna y formato de 
cada variable. Esta información se debe de verificar cuidadosamente con la hoja 
de codificación o el cuestionario para asegurar que los datos han sido traducidos 
apropiadamente. Suponiendo que todo está bien, se puede iniciar el proceso para 
generar frecuencias o distribución univariable. Esta salida permito verificar el 
grado de limpieza de los datos para empezar a realizar análisis más avanzados. 


* El formato pertenece a uno de los estudios científicos que ha realizado el autor, algunos de los 
datos y análisis de este estudio se explicarán en este apéndice como ejemplo. 
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Ejemplo: 


Para obtener el primer listado, suponiendo que sus datos (información) ya han 
sido guardados en la computadora, lo primero que se debe hacer después de 
haber encendido la pantalla o terminal de cómputo es darle la clave correspon- 
diente (PASSWORD), a continuación y después de obtener el número de sesión 
se recurre al archivo para poder obtener el listado. Para recurrir a un archivo se 
hace mediante la orden de GET FILE y el nombre del archivo o archivos 
requeridos, después de esto se da la orden de RUN (corrida de programa). A 
continuación se da la orden más común para correr un programa por medio del 
paquete SPSS. RUN *SERVICIO/SPSS; FILE FILES (DISK, TITLE = nombre 
del archivo de datos, FILE TYPE = 7). 

Lo que realiza la computadora por medio de esta instrucción es juntar los 
dos archivos y realizar las Órdenes o mandatos ordenados en el programa. 
Después de que la computadora dé los tiempos de terminación del programa, és- 
te termina mediante la orden O mandato de BYE y se procede a recoger el listado 
del programa. A continuación se da un ejemplo de un programa para obtener fre- 
cuencias y estadísticas de una de las investigaciones del autor. 


1 16 

RUN NAME PRODE/GENERAL 

DILE NAME ENCUESTAS SOBRE PRODE 

VARIABLE LIST VI, VO021 TO VO023, V3, V4, VS, V6, V7, V81 TO V83, V91, V92, 


VIO, V11, V12, V13, V14, V141, VIS, V16, VIT, V19, V20, V21 
TO V45, V47, EDO, VS0, VS1, TO V54 
INPUT MEDIUM DISK 


INPUT FORMAT FIXED (16F1.0, F2.0, 2F10, F4.0, 4F1.0, 25F1.0, X, 1F1.0, 6X, 
F2.0, F2.0, 4F1.0) 

N OF CASES 6403 

VAR LABELS VIES AFICIONADO AL DEPORTE/ 


V021 CUAL ES SU DEPORTE FAVORITO A/ 

V022 CUAL ES SU DEPORTE FAVORITO B/ 

'V023 CUAL ES SU DEPORTE FAVORITO C/ 

V3 CUALES SU EQUIPO FAVORITO DE FUTBOL/ 

V4 CUALES SU EQUIPO FAVORITO DE BEISBOL/ 

VS CUAL ES SU EQUIPO FAVORITO DE AMERICANO/ 

V54 CUANTO GASTA EN SORTEOS EXTRAORDINARIOS 
VALUE LABELS VI (1) SI (2) NO/ 

'V021 TO V023 (1) FUTBOL (2) VOLIBOL (3) BASKETBOL 

(4) BEISBOL (5) NATACION (6) AMERICANO (7) TENIS 

(8) OTRO! 

V3 (1) AMERICA (2) UNIVERSIDAD (3) GUADALAJARA 

(4) CRUZ AZUL (5) TOLUCA (6) OTRO! 

V4 (1) DODGERS (2) YANQUIS (3) TIGRES (4) DIABLOS 

(5) FILADELFIA (6) PERICOS (7) OTRO/ 

V54 (1) MENOS DE 500 (2) DE 501 A 1000 (3) DE 1001 

A 2000 (4) DE 2001 A 10000 (5) DE 10001 A 20000 


(6) MAS DE 20000 
MISSING VALUE VITO V54 (0) 
FREQUENCIES GENERAL = ALL 
STATISTICS ALL 


READ INPUT DATA 
FINISH 
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A5.6 LIMPIEZA (CORRECCIÓN) DE DATOS 


Cuando se verifica que el formato de insumo era correcto y todos los datos están 
en sus formas planeadas se usará PRINTOUT para la frecuencia y determinar si 
hay respuestas no válidas. Ejemplo, suponga que la variable 11 está codificada 
así: Y 11; 

1 - Sí, pero dejé de comprar 2 — Sí, sigo comprando 3 — No, pero se encuen- 
tra un número “S”listado en la frecuencia para la variable 11, este número se 
puede eliminar usando RECODE en el procesamiento de datos combinado con 
MISSING VALUES y SAVE FILE. Se recodificará el valor incorrecto a otro 
valor que se designa como no respuesta (MISSING). Como sigue: 


1 16 
RECODE VI1(0=5)(0=5) 
MISSING VALUES VI1 (0) 

Otras modificaciones 
SAVE FILE 
FINISH 


A5.7 DISTRIBUCIÓN UNIVARIABLE 


Se conoce el resultado de los listados de frecuencia, como una distribución uni- 
variable de los grupos de respuestas para cada variable. Como ya se corrigieron 
los datos se puede generar un resumen de las estadísticas univariables, incluyen- 
do, media, error estándar, mediana, moda, desviación estándar, varianza, rango, 
etcétera. Si se desean generar todas estas estadísticas, se deben pedir a la compu- 
tadora. Ejemplo: 


1 16 
FREQUENCIES GENERAL = ALL 
STATISTICS ALL 


Si se desea ahorrar tiempo de cómputo, se pueden seleccionar sólo algunas 
estadísticas disponibles, especificando nombre, código y la estadística requerida 
en el archivo de especificación. 

Quizá desea generar un resumen de estadísticas en la variable (45) y no le 
interesa saber la frecuencia actual de la distribución. Se debe de proceder con 
CONDESCRIPTIVE como se muestra a continuación: 


1 16 
CONDESCRIPTIVE Vas 


Cabe mencionar que con el CONDESCRIPTIVE no se necesita el formato 
de STATISTICS. 
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A5.8 DISTRIBUCIÓN BIVARIABLE 


El análisis bivariable permite ver la relación asociada entre dos variables.* Se 
puede observar cómo una variable covaría con otra. Con el análisis bivariado no 
sólo se puede determinar si existe la relación (prueba de significancia), sino que 
también el grado y dirección de la relación (medida de asociación). 

Datos nominales y ordinales. El procedimiento de cruzamiento de datos en 
SPSS (CROSSTABS) está designado específicamente para las variables nomi- 
nales y ordinales. 

El procedimiento es el siguiente: 


' 16 

CROSS TABS TABLES - VARIABLE 11 BY VARIABLE 45 
[B Y VARIABLES] / VARIABLE 10B Y 
VARIABLE 44 [B Y VARIABLE 6] / 


Las variables 11 y 10 son variables dependientes, las variables 44 y 45 son 
variables independientes y las variables $ y 6 son variables de control. El uso de 
las variables de control es opcional. 


Ejemplo 


Suponga que se desea medir la relación entre la compra de quinielas de pronósti- 
cos deportivos y la afición al deporte. 


1 16 
CROSS TABS TABLES = V] 1B Y VI 
STATISTICS ALL 


Esta instrucción a la computadora produce la tabla AS.2. 
A5,8.1 Interpretación 


En la tabla AS.2 la celda marcada en negro se puede interpretar de la siguiente 
manera: De los aficionados al deporte, 86.8 por ciento que no compran quinielas 
son aficionados al deporte (ROW PCT), mientras que 54.8 por ciento de los que 
son aficionados al deporte no participan en los Pronósticos Deportivos (COL 
PCT). El número 1921 (COUNT) significa que dentro de los entrevistados 1921 
tuvieron ambas categorías. El 1921 es 50 por ciento de todos los respondentes 
3846, en el muestreo. 

La tabla A5.2 tiene 3 renglones y dos columnas. La estadística de Ji cuadra- 
da 1? es una función del número de celdas en la tabla. El Ji cuadrada en esta 
tabla es x? = 129.5 con 2 grados de libertad (Número de renglón — IX Número 


* Enel capítulo 12 se explica con detalle. 
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Tabla A$.2 Afición al deporte de los compradores de quinielas. 
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de columna —1), y un nivel de significancia d = 0.00. La interpretación corres- 
pondiente es que estas dos variables tienen una relación significativa con un 
nivel de confianza X = 0,001, es decir, que básicamente los aficionados al 
deporte son el mercado potencial de Pronósticos Deportivos. Se puede medir el 
grado de asociación con la estadística Y de CRAMER o coeficiente de contin- 
gencia. Por lo general, el coeficiente de contingencia es una medida adecuada 
para dos variables de igual valor, es decir, tablas con el mismo número de colum- 
nas y renglón. La estadística V de CRAMER es .184 que es un grado de aso- 
ciación no muy fuerte, pero bastante aceptable, la que indica también que hay 
gente que no es aficionada al deporte pero compra quinielas, tal vez por otras 
razones como puede ser el gusto a cualquier tipo de juegos de azar. 

Se pueden eliminar estas respuestas, temporalmente, quitando la categoría 
correspondiente utilizando un RECODE, o un SELECT IF. Se obtendrá el mis- 
rno resultado si se utiliza cualquiera de los siguientes procedimientos antes de la 
tarjeta de CROSSTABS. Recuerde que esta transformación es temporal por lo 
que no se requiere SAVE FILE. 


1 16 
RECODE VI = 0) /VIG=0) 
SELECTIF (VILLTO ORVILTO) 


Frecuentemente el investigador tiene interés en analizar la relación entre 
ciertas categorías de una variable dentro de la muestra. Se puede lograr esto 
mediante el cruzamiento de datos incluyendo una variable de control en las 
tablas. Sin embargo, si nos interesa una sola categoría en la variable de control 
(o si se está usando otro procedimiento que no permite el método de control), el 
procedimiento que no permite es la forma más cómoda de separar las categorías 
de una variable. 

El formato de la tarjeta de SELECT IF es: 


1 16 
SELECT IF (VAR NAM [LOGICAL CONNECTOR] 
VALUE) 


Donde los conectores lógicos son: 


Conectar Significancia 

EQ es igual a 

LT es menor que 

LE es menor o igual a 
GT es mayor que 


GE es mayor o igual a 


DISTRIBUCIÓN BIVARIABLE 497 


Y el valor puede ser un número o nombre de otra variable. El procedimiento 
de SELECT IF puede ser más complicado cuando se piden oraciones de los 
componentes lógicos. 

Finalmente se puede usar SELECT IF y RECORD para la conexión, selec- 
ción y cancelación de ciertas categorías. 


Ejemplo: 
1 16 
SELECT IF V8 EQ 1 Y V6/EQ=1 
RECODE V11(3=0)V1(3=0) 
CROSS TABS TABLES = V1 1B Y VI 
STATISTICS ALL 


Esto excluye a las mujeres en las variables dependientes e independientes. 
A5.8.2 Datos intervalores 


El subprograma de SPSS en el cálculo de correlación Pearson (PEARSON 
CORR o Pearson Product — Moment Correlation) son estadísticas apropiadas 
para medir la asociación en las variables intervalores, y se puede probar el grado 
de significancia con la estadística £ de estudiante. En la mayoría de los casos el 
coeficiente generado por PEARSON CORR equivale al coeficiente de 
Spearman, producido por NONPAR CORR cuando la variable está medida en 
nivel ordinal, Por lo tanto, se presenta el coeficiente de Pearson como una 
estadística apropiada para las variables, ordinales-ordinales, ordinal-intervalor o 
intervalor-intervalor. 


1 16 
PEARSONCORR — V45, V43, V44, V11 
OPITIONS 3 

STATISTICS ALL 


El procedimiento produce una tabla que muestra el promedio y desviación 
estándar de cada variable y otra tabla incluyendo el coeficiente, y el nivel de sig- 
nificancia, ver tabla AS. 

Es posible que uno desee dibujar el escalograma para visuafizar la relación 
entre variables, El subprograma de SPSS (SCATTERGRAM) dibujará esta 
relación y calculará r de Pearson, r cuadrada y nivel de significancia de r, error 
estándar de la estirnación, la intercepción y la pendiente de la curva. 


Ejemplo: 
1 16 


SCATTERGRAM — V45, VI 
STATISTICS ALL 
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A5.9 ANÁLISIS MULTIVARIADO 


El análisis multivariado tiene tres funciones principales: el control, inter- 
pretación y predicción.* Técnicamente se pueden lograr las dos primeras fun» 
ciones del análisis multivariado, mediante el uso de variables de control; en los 
subprogramas de cruzamiento de Datos (CROSSTABS) o Correlaciones 
Parciales (PARTIAL CORR). 


A5.9.1 CROSSTABS multivariado 


En este apéndice se habla de cruzamiento de datos e incluso se dan ejemplos 
de la aplicación de la variable de control; con ellos será más fácil de entender. 
En un análisis bivariado donde las tablas de cruzamiento tienen las mismas 
variables dependientes e independientes pero controladas por sexo o por otra 
variable, por ejemplo, en la primera tabla todos los casos son mujeres y en la 
Otra tabla todos son hombres. 


A5.9.2 Correlación parcial 


Conceptualmente el análisis de correlación parcial es similar a CROSSTABS 
multivariado en donde controlan el efecto de otras variables en el momento del 
análisis de relación entre variables originales. Pero hay una gran diferencia entre 
estos dos métodos de control. El CROSSTABS físicamente quita el efecto de 
algunas variables, mientras que el PARTIALCORR quita el efecto de algunas 
variables estadísticamente. Es decir, para fines de control el CROSSTABS eli- 
mina algunos casos; esto es un defecto muy importante porque cuando controla 
más de una variable la separación física de las variables de control reducen las 
frecuencias de las celdas de la tabla. Por lo tanto, cuando el análisis obliga el 
control de más de una variable o cuando el N es pequeño el PARTIALCORR es 
recomendable. 


1 16 
PARTIALCORR V11 WITH VI, V10, V45, B Y V43m V41 (1, 2) 
STATISTICS ALL 


Aquí la variable dependiente es V11, las variables independientes son V, 
V10 y V45 y las variables de control son V43 y V41. Este ejemplo no propor- 
ciona correlación parcial de orden ZERO, Primer Orden, Segundo Orden porque 
sólo tienen dos variables de control, se puede lograr hasta cinco órdenes de co- 
relación parcial. En el ejemplo Zero Orden sería calcular las correlaciones par- 
ciales controlando para V43 y V41 al mismo tiempo. La correlación parcial de 
Primer Orden en el ejemplo sería V11 con V1, V10 y V45 controlando sólo V43 
y la correlación parcial de Segundo Orden sería V11 con V1, V10 y Vá5 con- 
trolando a V41. 


* En el capítulo trece se explican los principales modelos de Análisis Multivariado. 
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A5.9,3 Regresión múltiple 


Con frecuencia hay varias variables independientes que proporcionan informa- 
ción para explicar la varianza de una sola Variable Dependiente. Regresión 
Múltiple es un subprograma de SPSS que puede hacer tal cosa simultáneamente. 
La Regresión Múltiple es una técnica descriptiva e inferencial. Aunque las 
dos técnicas están relacionadas es conveniente tratarlas por separado. 
La parte descriptiva de la Regresión Múltiple consiste en: 


1. Encontrar la mejor ecuación lineal para predecir y evaluar el grado de 
precisión de la ecuación. 

2. Controlar para factores equivocados y poder evaluar la contribución de 
una variable específica a una serie de variables. 

3. Encontrar relaciones estructurales y proporcionar información para que 
el investigador pueda explicar las relaciones complejas multivariadas. 


La parte inferencial de la regresión se refiere a que la relación de la 
población o universo del estudio se analizará mediante el análisis de los datos 
muestrales”. 

El formato de la regresión consiste en que se deben definir las variables que 
estén incluidas en el análisis y determinar la variable dependiente, las variables 
independientes y el proceso de análisis. Por ejemplo, 


1 16 

REGRESSION VARIABLE = DEPENDENT VAR, INDEPENDENT 
VARI, INDEPENDENT VAR?, ... INDEPENDENT VAR N 
(Números pares) 

STATISTICS 1,2,3,4,5,6 


Los números pares escritos entre paíéntesis indican que entran todas las 
variables independientes en la ecuación simultáneamente. 

Después de la especificación de la información necesaria, los siguientes 
resultados se imprimirán en la salida del cómputo: 


+ Matriz de correlación. 

+ Medias y desviación estándar de cada variable. 

» Tabla de análisis de varianza estadística R, R? y los cambios en R? atribui- 
dos a cada variable; r de Pearson para cada variable independiente con la 
variable dependiente, los b (coeficientes de las variables independientes) 
los Betas y la intercepcion a. 


*Nie, Noman, Hull Hadia; Jenking Jean Steinbenner Karin y Bent Dale, Statistical Package for the 
Social Sciences, McGraw-Húl Book Company, Nueva York, 1980, p. 321. 
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Ejemplo: 
Tabla AS. 3 

1 RUN NAME CASO LACTAMA TIPO A 

2 FILE NAME LACTAMA A 

3 VARIABLE LIST Y, X1, X2, X3, X4, X5, X6 

4 INPUT FORMAT FIXED (F3.0, 3F5.2, F6. 1, FS. 1, FT.0) 


ACCORDING TO YOUR INPUT FORMAT, VARIABLES ARE TO BE READ AS 


FOLLOWS 

VARIABLE FORMAT 
Y P30 

Xi F5.2 

x2 F5.2 

x3 F5.2 

x4 F6.1 

X5 FS.1 

X6 FO 

5 NOFCASES 


6 VAR LABELS 


11 
n 


13 REGRESSION 


14 


15 OPTIONS 
20 STATISTICS 


RECORD COLUMNS 


1-3 
4-38 
9-13 
14-18 
19-24 
25-29 
30-36 


10 
Y, VENTAS LACTAMA A/ 
X1, PREC, VTA. LAC. A/ 
X2, PREC. VTA. LAC. B/ 
X3, GASTOS DE VTA / 
X4, IND. QUIHICA / 
X5, IND. TEXTIL / 
X6, PIB / 
VARIABLES = Y, XI, X2, X3, X4, X5, X6/ 
REGRESSION = Y WITH Xi TO X6 (2) 
RESID = 0/ 
8,10, 11, 12 
ALL 
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AS.9.4 Análisis discriminante 


Es un modelo multivariado que permite distinguir dos o más grupos. Por ejem- 
plo, si el director de la empresa desea conocer las características de los clientes 
que pagan a tiempo y quiénes no, se debe de usar el análisis discriminante para 
distinguir estos grupos, sus características y las variables que discriminan entre 
estos dos, 

El formato de análisis discriminante es 


1 16 

DISCRIMINANT GROUPS = Vi (Valor) / 
VARIABLES = Vi, V2, 
ANALISIS = Vl, V2,--- —Vw 
METHOD = WILKS o RAO/ 

OPTIONS NO. OF OPTIONS 

STATISTICS ALL 


El análisis discriminante multiplica el valor de cada variable independiente 
por su peso correspondiente y la suma de estas multiplicaciones es valor dis- 
criminante, o puntuación discriminante para cada caso. El promedio de estas 
puntuaciones de todos los casos en un grupo proporciona la media del grupo 
(centroid), En un análisis de dos grupos se calcularán dos medios, en el análisis 
de tres grupos tres medios y así sucesivamente. También el análisis proporciona 
información para la prueba de significación para las funciones discriminantes. 


Ejemplo. 


Suponga que se desea saber quiénes compran billetes de Lotería Nacional y 
quiénes no, es decir, distinguir estos dos grupos. Se torna la variable 51 (compra 
usted billetes de la Lotería Nacional I- Sí, 2— No) como variable dependiente 
contra cinco variables independientes: 


V1 =Es usted aficionado al deporte 
V41 = Sexo 

V42 = Edad 

143 = Nivel de escolaridad 

V45 = Ingreso 


El formato de este análisis en nuestro caso sería: 


1 16 

DISCRIMINANT GROUPS = V51 (1, 2/ 
VARIABLES VI, V41, V42, V43, V45/ 
ANALISIS = V1, V41, V42, V43, V45/ 
METHOD = WILKS/ 

OPTIONS 3,5,8,11, 12, 18 

STATISTICS ALL 
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El sub-programa discriminante realiza el Análisis y se presenta el resultado 
de la siguiente manera: 


Tabla AS.5. Muestra del lambda de Wilk, F y nivel de significancia. 


Variable Lambda de Wilk F Significancia 
vi 0.99769 9.978 0.0016 
val 0.98327 73.23 0.0000 
Vaz *0.95183 217.9 0.0006 
v43 0.98525 64.47 0.0000 
vas *0.96558 *153.5 0.0000 


La tabla AS.5 demuestra dos variables muy importantes dentro del modelo, 
las variables de edad y de ingreso, que también tienen una lambda de Wilk 
menor que otra (entre menor sea la lambda de Wilk mayor será el poder discri- 
minante de la variable correspondiente). Todas las variables menos la variable 1 
son significativas). 

La tabla A5.6 demuestra el resultado final del análisis discriminante (ver 
parte c de la tabla). El valor de la lambda de Wilk 0.9248946 indica que no hay 
un grado de separación importante; esta declaración se puede verificar con el 
valor de correlación canónica 0.2740536. El valor de correlación canónica es 
bajo, es decir, no existe mucha correlación. El valor de Ji cuadrada indica que la 
función discriminante es significativa; es decir, la información incluida en la fun- 
ción discriminante, estadísticamente es significativa a un nivel de 0.0000. 

El subprograma de SPSS también proporciona dos medidas que sirven para 
examinar el grado de importancia relativa de la función discriminante; 1, es la 
correlación canónica y 2. es el valor Eigen. El valor Eigen demuestra la varianza 
total que existe en la función. Como se ve en la tabla AS.6, el valor Eigen del 
ejemplo es 0.08120 que es un valor muy bajo. 

Otra información que se debe interpretar son los coeficientes de la función 
discriminante (los b) que demuestran el grado de importancia de cada variable; 
en la parte D de la tabla A5.6 se ven estos coeficientes en el ejemplo. 

La parte E de la tabla A5.6 proporciona la media de cada grupo (centroid); 
como se ve hay una diferencia substancial entre estas dos medias; lo cual indica 
que existe una diferencia significativa entre estos dos grupos. 

El subprograma de SPSS proporciona más información valiosa. La matriz 
de la clasificación también se conoce como la tabla de Hit Miss. La tabla A5.7 
Muestra esta matriz. La matriz de clasificación indica con qué grado de precisión 
o eficiencia la función discriminante hubiera sido clasificada. Las observaciones 
que se utilizaron para el desarrollo de las funciones a sus grupos respectivos. 
Explicando de otra manera; esta matriz indica con qué probabilidad las variables 
de la función puede clasificar a la gente con las mismas características. 

El porcentaje de casos que se han clasificado correctamente se usan como la 
importancia de las variables independientes para la predicción de la pertenencia 
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del grupo. Este porcentaje es similar al valor R? (coeficiente de determinación) 
en el análisis de regresión. 


Tabla AS.7 
Group 
mem- 
Actual group No. of cases Predicted 1 bership 2 
GROUP 1 1377 823 554 
sI 59.8% 40.2% 
GROUP 2 2930 1053 1877 
NO 35.9% 64.1% 
UNGROUPED CASES 2096 723 1373 
34.5% 65.5% 


PERCENT OF “GROUPED” CASES CORRECTLY CLASSIFIED: 62.69% 


En nuestro caso el número de casos que han sido clasificados correctamente 
son: 


823 + 1877 = 2700 


Como el total de casos que se utilizaron para la predicción de la pertenencia 
de grupos son 1377 + 2930 = 4307. 

La eficiencia de las variables independientes para la predicción de pertenen- 
cia a grupo es 2700/4307 = 62.69 por ciento. 

La significancia estadística se puede calcular de la predicción usando la fór- 
mula: 


q PD A 


en este caso sería 


POE 
v(50) (50) 


12.69 
2= "3 + 65.62 


2 = (25.38) (65.62) = 16.65 


Como z = 16.65 2 esto indica que los variables independientes han contri- 
buido significativamente en la función discriminante. 
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Hay varios criterios para evaluar esta tabla. Uno de estos criterios presenta- 
dos por Morrison,* se basa en la comparación de] grupo aleatorio (el primer 
grupo, los que compran billetes de lotería contra el grupo de no compradores). 


Coro. = PÍ+ Pa 


pro, 


1377 + 823 9 ¡1053 + 1877 2 
(a ar) 


Cpro, = (51)? + (68? =.26 + 46 
Chro, = -72 por ciento 

Otro criterio para analizar esta matriz la presentaron Mostellar y Bush y lo 
denominaron criterio justo. La suposición de este criterio es que la probabilidad 
del grupo que ha sido clasificado correctamente depende de la probabilidad de la 
pertenencia de cada grupo (Pi) y la proporción a cada grupo (fi); se usa la fórmu- 
la: 

Cy=fP1) +A (Pr) 


En nuestro ejemplo: el Cy sería 


_,(823+1053) 823 +554 (554 + 1877 (1053 + 1877) 
q 4307 4307 4307) 4307 


Cy = (43557) (319712) + (5644299) (6802879) 


Cy = 52% 


AS.10 ANÁLISIS DE FACTORES** 


Análisis de Factores, es un modelo estadístico multivariado que recientemente 
ha sido aplicado en numerosos casos de la administración y contaduría, especial- 


* La aplicación del análisis de factores requiere conocimiento amplio en correlación y coeficieme de 
regresión, los que no tienen conocimiento de los temas mencionados, se les sugiere la no aplicación 
del Análisis de Factores. 

** Morrison Donald, Multivariate statistical methods. Segunda edición, McGraw-Hill, Nueva York, 
1976. 
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mente en recursos humanos y mercadotecnica. El principal objetivo del análisis 
de factores es la reducción de datos. El análisis de factores proporciona los coe- 
ficientes de correlación de las variables, además, permite reorganizar o reducir 
las variables a ciertos factores que serán sometidos a análisis posteriores. Es 
decir, reduce las variables: por ejemplo, en nuestro caso se tienen más de 60 
variables, las que reduce a menos de 20 variables. Obviamente trabajar con 20 6 
15 variables es más fácil que con 60. El análisis de factores también es útil para 
la prueba de hipótesis; además, se puede utilizar este análisis para crear nuevas 
variables, es decir, se puede multiplicar el valor del coeficiente de correlación de 
cada variable a su valor correspondiente, la suma de esta operación proporciona 
otra variable que será sometida a otro tipo de análisis con un nuevo nombre. 

El subprograrna SPSS correspondiente al análisis de factores proporciona 
varias técnicas, El análisis de factores VARIMAX es el más común. 

El formato del análisis de factores es el siguiente: 


1 16 
FACTOR VARIABLE = variable list/ 
FACTORS — = No, de factores/ 
ROTATE . = VARIMAX u otras técnicas / 
STATISTICS ALL 
Ejemplo. 


El estudio de control de natalidad realizado en el estado de México, tuvo más de 
80 variables, se decidió encontrar tres factores importantes* (según el 
conocimiento del investigador respecto al número de factores), el formato de 
este análisis es el siguiente: 


1 2 

FACTOR VARIABLES = X29, X301 To X304, X311, X313 To X317/ 
FACTORES =3/ 
ROTATE — = VARIMAX 

STATISTICS ALL 


El subprograma de SPSS correspondiente al análisis de factores proporciona 
los siguientes resultados importantes (ver las tablas A5.8-A5.11 y la figura 
AS.1). 


* El cuestionano de este caso se puede ver en la obra de Namakforoosh Mohammad N. y Saldaña 
Espinosa Judit, Administración de los programas de planificación familiar, LIMUSA, 1983, 


México. , 
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Tabla A5.8 Matriz factorial usando factores parciales con iteraciones. 


FILE ENCUESTA (CREATION DATE = 9/17 ¡82) 
FACTOR 1 FACTOR 2 FACTOR 3 
x29 37642 —.34200 .19718 
X301 77023 17192 24087 
X302 54000 —.26486 .11316 
X303 08909 03496 06356 
X314 05082 28570 — 48014 
X311 19908 —.01787 15168 
X313 16822 —.03249 04722 
X314 04995 08879 00884 
X315 07955 10968 .10998 
X316 04787 00174 20147 
X317 03334 58211 27682 
x32 72419 43291 25696 
X33 78919 42345 20310 
X34 -16574 —.05671 -31224 
—.21992 17029 
17449 -.01328 
34040 01589 
26782 04305 
53119 52786 


Tabla AS.9. Comunalidades finales y porcentaje de la varianza común. 


FILE ENCUESTA (CREATION DATE = 9/17/82) 
VARIABLE COMMUNALITY FACTOR EIGENVALUE PCTOF VAR CUMPCT 


x29 92395 1 2.97475 53.4 53.4 
X301 -68083 2 1.57817 28.3 81.3 
X302 3751 3 1.01475 182 100.0 
X303 01320 
X304 31474 
X311 06296 
X313 03158 
X314 01046 
X315 03045 
X316 04288 
X317 41659 
X32 17789 
X33 84338 
X34 12818 
X35 08384 
X36 06702 
x37 11643 
X38 07523 


X48 57235 
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Tabla A 5. 10, Matriz ortogonal de factores 


FILE ENCUESTA (CREATION DATE 9/17/82) 


'“VARIMAX ROTATED FACTO MATRIX 


FACTOR 1 FACTOR 2 FACTOR 3 
x29 94922 00063 15142 
X301 81961 09272 02169 
X302 59979 —.04564 .11780 
X303 09099 04803 05112 
X304 03798 —.08896 55262 
X311 23525 02123 — 08466 
xX313 «17561 02619 00752 
X314 02106 09472 03230 
X315 07654 09564 -.12429 
X316 11254 —.03724 —.16980 
X317 29966 37160 00792 
x32 42454 74265 21477 
X33 50394 74519 .18471 
X34 05478 .10784 .33697 
X35 07729 -.10923 25678 
X36 .11291 23241 —.01596 
X37 -.11109 28386 —.15332 
X38 —.02853 23645 —.13602 
Xa48 —.06864 26538 —.70513 
TRANSFORMATION MATRIX 
FACTOR 1 FACTOR 2 FACTOR 3 

FACTOR 1 .88824 40430 21809 
FACTOR 2 29743 86797 39771 


FACTOR 3 35009 —.28839 -.89122 
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Tabla AS. 11. Matriz de factores estimados. 


FILE ENCUESTA (CREATION DATE = 9/17/82) 


FACTOR SCORE COEFICIENTS 
FACTOR 1 FACTOR 2 FACTOR 3 

X29 1.47508 48301 .15345 
X301 —.54154 .18889 21127 
X302 —.16076 04150 -.02542 
X303 06013 00230 01183 
X304 18777 01999 22030 
X311 02824 -01381 —.08781 
X313 02409 —.02538 00731 
X314 03982 00860 -.02374 
X315 04985 —.02023 —.07058 
X316 02011 — 01694 —.06482 
x317 —.15188 24132 30689 
X32 .19108 14680 24587 
X33 01943 65878 02953 
X34 -.01200 04278 .10866 
X35 02755 — 04840 06237 
Xx36 —.00342 03581 —.05241 
xX37 -.03198 .12052 02973 
X38 —.04627 07190 03383 


Xa48 03264 10309 -.56183 


53 
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A5.10.1 Interpretación 


Hay que tomar cuatro decisiones básicas en el análisis de factores; estas deci- 
siones son: número de factores, cuáles variables incluir en el análisis, cuáles 
resultados finales usar y qué nombre asignar a cada factor. 


Hay varios criterios para determinar el número de factores por extraer. Un 
procedimiento muy común y sencillo es usar el valor Eigen, que se conoce como 
“raíz latente”. Donde el valor de Eigen sea igual a la varianza común, se corta el 

Valor Eigen 

Número de variables 
para determinar el porcentaje de la varianza que se debe usar como un criterio pa- 
ra determinar el número de factores, Se puede usar dicho criterio de la siguiente 
forma: 


análisis de factores. También se puede usar la fórmula ( 


1. Incluir suficientes factores para alcanzar el nivel de criterio de la varian- 
za total. 

2. Usando factores que explican la mínima varianza que una variable inde- 
pendiente debe de explicar. 


Se puede usar otro criterio —conocido como criterio a priori en donde el 
investigador antes del análisis sabe cuántos factores extraer. El investigador 
obtiene esta información de otros estudios similares por medio de la prueba de 
hipótesis o basado en ciertas teorías. 

En el ejemplo se aplicó la segunda técnica (el criterio a priori) y se determi- 
naron 3 factores, como se puede ver en la tabla AS.9, todos los factores tienen 
un valor Eigen mayor que uno. 

Ya se explicó que hay varias técnicas de análisis de factores; quienes usan 
análisis de factores con poca frecuencia, posiblemente las técnicas de rotación 
ortogonal, será la mejor selección. Dentro de las técnicas de rotación ortogonal, 
Varimax es la más común. 

Interpretación de la tabla AS.8: Se puede observar el peso de cada factor 
que corresponde a cada variable. Cada peso en cada factor representa la corre- 
lación entre la variable original y su respectivo factor. Se consideran importantes 
los pesos mayores de + .40 y los pesos 1.50 significativos. Entonces, los más 
grandes que sean el peso del factor en valor absoluto, los más significativos se 
considerarán tal peso en la matriz de factores. Pero cabe mencionar que el ta- 
maño de cada peso depende del número de variables que se considerarán en el 
análisis. Hay una relación inversa entre el número de variables y el nivel de sig- 
nificancia de los pesos de los factores, si aumenta el número de variables dis- 
minuye el nivel de peso. 

En la tabla A5.8 y tabla A5.11 cada columna representa un factor. Para la 
interpretación, el investigador debe empezar de la primera variable en el primer 
factor y leer en forma horizontal de izquierda a derecha, para encontrar el peso 
más alto para cada variable en cada factor. Cuando se encuentra el peso más alto 
en cada renglón, si este peso es significativo hay que marcarlo. El investigador 
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continuará su análisis en el siguiente renglón o variable, leyendo otra vez los 
pesos de cada factor de izquierda a derecha horizontalmente para encontrar el 
peso significativo. El investigador continuará este proceso hasta analizar todas 
las variables o renglones de la matriz de los factores. Las variables que no 
fueron significativas se pueden quedar dentro del factor y el investigador inter- 
preta cada factor ignorando los pesos no significativos o el investigador elimina 
estas variables y procesa otro análisis de factores. 

Respecto al nombre de factores, el investigador tiene que ver la(s) 
variable(s) con máximo peso y dar el mismo nombre de la variable a tal factor. 
En otro ejemplo, en donde se usan los mismos datos y se extraen seis factores 
(ver tabla AS.12) en el primer factor, edad de los hijos, tuvo mayor peso dentro 
del primer factor, por lo que se nombró edad de los hijos. En el segundo factor, 
influencia de la maestra de la localidad sobre las mujeres respecto a control de la 
natalidad resultó más significativo por lo que a este factor se denominó “influen- 
cia de la maestra” y así sucesivamente. 

Este ejemplo indica otro uso del análisis de factores en el que se trata de 
crear nuevas variables para elaborar distintos análisis. La tabla AS.12 presenta la 
matriz de los factores y se puede usar el formato COMPUTE, para generar 
nuevas variables multiplicando el valor de cada variable por su coeficiente 
(peso) en cada factor. La suma de estas multiplicaciones será una nueva variable 
(ver la tabla AS.13). 

Después se pueden realizar otros análisis, como en nuestro caso, con las 
nuevas variables se elaboran análisis discriminantes (tabla A5.13). 


AS.11 MEDICIÓN 


En el capítulo 9 se explicaron los métodos para medir la actitud de encuestados. 
Se midió la actitud construyendo escalas o índices con indicadores para una acti- 
tud particular. SPSS es fácil de utilizar y ofrece varias formas para construir 
escalas uni y multidimensionales. Se pueden usar análisis de FACTORES, 
Transformaciones de IF, u operaciones COUNT según la experiencia, habilidad 
y conocimiento que uno tenga en metodología. En este apéndice solamente se 
trabaja con la técnica para desarrollar la escala GUTTMAN. 


A5.11.1 Componentes básicos de la medición 


Es muy común en una investigación, crear o transformar variables. Tal vez la 
transformación COMPUTE puede ser la más usual en SPSS, ya que puede satis- 
facer dichas necesidades del investigador. El formato es muy simple y sólo 
requiere expresiones matemáticas para crear mediciones compuestas. Por ejem- 
plo, se puede sumar ( + ) restar ( — ), multiplicar (*), dividir (/), y exponenciar. 
Es un formato muy flexible, en donde se puede expresar el nombre de la va- 
riable, o número de variables (números reales o enteros). 
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Tabla A5.13, Presentación de cómo generar nuevas variables con los coefi- 
cientesde los factores. 


COMPUTE VI = (.72879*X29) + (30008*X301) + ( —.0135 1*X304) + 
(.00763*X311) + (.01141*X312) + ( —.01080*X313) + 
(—.0007*X314) + (—.00485*X315) + (.00395*X316) + 
(—.00479*X32) + (—.0626*X33) + ( —.00567*X34)+ 
(—.07191 *X35) + (.02449*X36) 

COMPUTE V2 = (—.41093*X29) + (—.12431*X301) + (.00110*X304) + 
(.00225*X311) + (—.01244*X312) + (.01434*X313) + 
(.00992*X314) + (.01479*X315) + (.00103*X316) + 
(.00442*X317) + (.54704*X32) + (.59548*X33) + 
(.01128*X34) + (.09743*X35) + (.01578*X36) 

COMPUTE V3 = (.00864*X45) + (.O1030*X54) + (.01997*X55) + 
(52962*X56) + (23700*X57) + ( —.26429*X58) + 
(—.5959*X59) + (.00186*X60) + ( —.02871*X61) + 
(.00229*X62) + (—.00481 *X63) + (01735 *X64) + 
(01419*X65) + (.02205*X66) + (.02474*X67) + 
(.01213*X68) + (—.01355*X69) + ( —.00043*X70) + 
(.02106*X71) + (.02038*X72) + ( —.00557*X73) + 
(—.05849*X74) + ( —.05080*X75) + (03872*X76) + 
(—.05113*X77) + (—.07500*X78) + (.04920*X79) 

COMPUTE V4 =(—.0073*X45) + (.00488*X54) + ( —.01284*X55) 
(—.10801 *X56) + (—.044563*X57) + ( —.01372*X58) + 
(.53907*X59) + (.52194*X60) + (.0607*X61) + 
(.01557*X62) + (—.00416*X63) + ( —.01869*X64) + 
(.02962*X65) + (.01443*X66) + (.02024*X67) + 
(01 426*X68) + (¿00601 *X69) + (.00442*X70) + 
(.00573*X71) + (.01283*X72) + ( —.02023*X73) + 
€ —.05849*X74) + (—.05080*X75) + (.03872*X76) + 
(—.03228*X77) + (.05510*X78) + (.02819*X79) 

COMPUTE VS = (.04321*X1) + (.1479*X6) + (01066*X7) + 
(—.07085*X8) + (.00485*X9) + ( —.06602*X91) + 
(—.02251*X10) + (.14249*X13) + (.12107*X141) + 
(29755*X143) + (45731*X151) + (—.01260*X152) + 
(.01368*X153) 

COMPUTE V6 = ( —.00882*X1) + ( —.00997*X6) + ( —.0L609*X7) + 
(.01836*X8) + (—.208853*X9) + (.74120*X91) + 


* SC puede declarar un máxinio de 12 variables y tres puntos de división. 
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El formato general de COMPUTE es: 


1 16 
COMPUTE COMPUTED VARIABLE - ARITHMETIC EXPRESSION 


Si se procesa una nueva variable y después se usa un formato SAVE FILE 
dicha variable aparecerá en el archivo como una variable permanente. 

Cuando se precisa una nueva variable los casos que tienen valores de no 
respuesta (MISSING VALUE) no aparecerán en el proceso de creación de una 
nueva variable, SPSS proporciona un formato para solucionar este problema. 
Este formato se llama ASSIGN MISSING, ejemplo: 


1 16 
ASSIGN MISSING COMPUTED VARIABLE (Valor) 


AS.11.2. Desarrollo de escala Likert 


Se va a construir la escala Likert con los datos de la participación política cuyo 
cuestionario aparece en este apéndice. Las variables que se usan son V4, VS, 
V6, V9 y VIO. Se supone que la escala de Likert proporciona conceptos unidi- 
mensionales de la participación política; y las variables seleccionadas con- 
tribuyen támbién a dicho concepto, es decir, tienen la misma importancia. Las 
respuestas se pueden colocar en una forma continua entre políticamente inactivo 
y políticamente activo. En nuestro caso las variables están construidas de ma- 
nera que el valor mínimo de la variable denote inactivo y máximo valor como 
activo, Otra forma sería usar el formato RECODE para convertir los valores de 
las variables. Pero existen dos problemas: 


1. Se requiere una forma de mejorar el efecto de las variables que por 
razón de algunos valores de no respuesta (Missing Data) se excluyeron 
del estudio. 

2. En nuestro ejemplo (cuestionario) en algunas preguntas el Valor 1 repre- 
senta no participación en la política y en otras el Valor O representa la 
no participación, 


Los problemas mencionados se pueden resolver con RECODE. En la cons- 
trucción de la escala Likert se capta la palabra ACTIVO de la siguiente forma: 


1 16 

RECODE Va, VS, V6, V9, VIO (9 = 0) 
(Cambia “no sé” y Missing a un valor cero para maximizar el 
número de casos activos) 

RECODE V6, V9(0= 1)(1=2)(2=3)(3 = 4) 
(Provoca que todos los puntajes de no participación sean 1 y 
los puntales de sf participación sean 4) 

1 16 

COMPUTE ACTIVE = V4a VSa V6a V 104 
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Como ya se habían codificado todos los casos sin respuesta (“o”), no había 
tales valores con el formato ACTIVE. Sin embargo, si se desea reflejar los va- 
lores sin respuesta en el análisis, tal como están y eliminar los casos con valores 
sin respuesta en cualquier variable, se debe de ahorrar el primer formato de 
RECODE y escribir o perforar el siguiente formato antes de COMPUTE. 


1 16 
ASSIGN MISSING ACTIVE (0) 


Se pueden generar escalas con el formato de ACTIVE para las variables 
VI7 y V19, que miden la efectividad de los medios publicitarios, el formato 
COMPUTE se puede usar como se indica a continvación: 


1 16 
COMPUTE NMAGS = V17*+ V19 
ASSIGN MISSING NMAGS (9) 


A5.11.3 Escala de Guttman 


La escala de Gurtman es una escala acumulativa y unidimensional. Hasta aquí, 
todas las escalas unidimensionales de que se habla son aditivas; se supone que 
miden algo de ciertos conceptos básicos. Además, en la operación de la suma, el 
orden de la variable era acumulativo, es decir, V4 + V5 conceptualmente eran 
lo mismo que VS + V4. 

Algunas escalas unidimensionalos cuentan con interrelaciones y 10 operan 
características de los componentes de los ítems, por supuesto, más complicados. 
Tales escalas añaden pesos desiguales a los ítems a lo largo del cuestionario y 
ordenan los ítems por su grado de dificultad, la escala de Guttman es un ejemplo 
de éstas. 

Se puede discutir respecto al formato de ACTIVO, no se puede distinguir el 
grado de importancia de las variables, por ejemplo, algunas actividades políticas 
son nienos costosas que otras. Por ejemplo, se requiere menos tiempo y esfuerzo 
si se está solamente interesado en política V4, que votar en las elecciones locales 
V11, todavía es más costoso hacer ciertas aportaciones para ciertos partidos 
políticos, V12. Para evaluar un cuestionario y desarrollar escalas con la consi- 
deración de los casos antes mencionados se usa la escala de Guttman. El formato 
general para desarrollo de la escala es: 


1 16 
GUTTMAN SCALE SCALE NAME = VARIABLE NAME 
(Punto de división) 


VARIABLE NAME (Punto de división) 


El punto de división es igual al valor de una variable x donde y es > a un 
caso particular que se considera como aprobación de un ítem. 
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1 16 

GUTTMAN SCALE 14 (Q.5), V5 (1.5), V6 (1.5), V9 (2.5) 
v11 (2.5) 

OPTION 1 

STATISTICS 2,3,4 


La opción 1 permite que entren en proceso de computación todos los casos 
con valores sin respuesta (Missing value). Las estadísticas que se obtienen serán 
el coeficiente de reproductividad, margen mínimo de reproductividad y el por- 
centaje de mejoramiento que se alcanzó en la escala de Guttman. 
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